xiki-1014
xiki-1014
> > > > 问一下你说的是加上历史的时候验证模型的时候发现评分变高了是吗?这个应该不会影响你推理时候的对话效果吧?我个人是发现训练多轮的时候还不如训练单轮对话的数据效果好,多轮对话即使max_length设置了很开心了对话一句两句还行后面就无限重复前两句回答,不知道朋友情况如何..:) > > > > > > > > > 是的,这是加历史之前的评分 加了历史之后的评分是 评分确实高了,推理时候的对话效果应该不影响,只是看看能到多少分。单轮对话我没有训练过,只训练的多轮对话,效果分情况,有的表现好,有的表现差,我怀疑可能是数据样本不平衡造成的,我的数据是自己整理的也不是多,数据这块挺费时间的,我目前仍在修改数据。   > > > > > > 你表现好的模型 能进行几轮有效对话呢 不知道有没有出现发什么模型都回复同一句话的情况呢。 > >...