Zkkkai (SII)
Results
2
comments of
Zkkkai (SII)
Thanks for your reply!
似乎应该将下面这行代码去除,这样最后的loss mask是正确的,对于response的第一个token和最后一个token(EOS)的预测都会计算相应的loss https://github.com/volcengine/verl/blob/504696245b39dd22162579b36303706ee61a731a/verl/utils/dataset/sft_dataset.py#L197