RRHF
RRHF copied to clipboard
loss的代码关于batch size的处理有bug。
这里batch size设置为1时,逻辑没有问题。当batch size!=1时,会出现tensor size不match的情况。