LLMSurvey
LLMSurvey copied to clipboard
请教一个问题,在做指令问题的时候,验证集上计算损失和训练集是否一致
基于基座模型比如LLaMA系列进行指令微调,训练的损失函数是什么?在验证集上计算损失跟训练集上是否一致,谢谢!