RRHF
RRHF copied to clipboard
bug 计算sft损失的时候
计算sft损失的时候label和logits貌似没有shift,是我理解有问题吗? 应该是new_logits = logits[:,:-1,:]