Nan Hua

Results 1 comments of Nan Hua

把label设置成-100的目的是为啥?lora微调的做法是让模型的的前一个token能够预测出下一个token么?是这样的话,总感觉input_ids和labels对应关系错位了啊