RRHF
RRHF copied to clipboard
关于ppl的方差
我在hh数据集上训练模型,并统计ppl,只基于回答计算ppl,发现ppl的方差特别大,一些特别短的回复,比如"270 votes",ppl可以达到35000多,我看RRHF论文中没有提及ppl的方差,想问一下是否也有类似的情况