Nan Hua
Results
1
comments of
Nan Hua
把label设置成-100的目的是为啥?lora微调的做法是让模型的的前一个token能够预测出下一个token么?是这样的话,总感觉input_ids和labels对应关系错位了啊