Knover icon indicating copy to clipboard operation
Knover copied to clipboard

训练数据的组织形式

Open zhanghaoie opened this issue 3 years ago • 6 comments

Hi,我想请问下,中文模型训练的时候大部分都是多轮数据吗?还有单轮的比较多呀

zhanghaoie avatar Oct 08 '21 12:10 zhanghaoie

我训练了一个中文模型, 貌似nsp模型更倾向于给重复率较高的句子高分image

zhanghaoie avatar Oct 08 '21 12:10 zhanghaoie

请问你转换话题的时候效果如何?

guijuzhejiang avatar Oct 19 '21 01:10 guijuzhejiang

请问你转换话题的时候效果如何?

我这边发现话题转换效果轿车。。。

kev1876 avatar Oct 19 '21 06:10 kev1876

请问你转换话题的时候效果如何?

我这边发现话题转换效果轿车。。。

轿车。。。SUV不行吗? 我这边测试转换话题时,机器人的回复还是聚焦在话题转换前的问题上,你呢?

guijuzhejiang avatar Oct 20 '21 00:10 guijuzhejiang

我这边测试转换话题时,机器人的回复还是聚焦在话题转换前的问题上,你呢?

较差哈,是的,我和你一样。

kev1876 avatar Oct 20 '21 08:10 kev1876

NSP 这一个任务比较简单,同一话题(表现上就是词重复度高的)的回复得分往往比较高,后续可以继续优化

sserdoubleh avatar Oct 20 '21 08:10 sserdoubleh