dazhaxie0526

Results 3 issues of dazhaxie0526

基于基座模型比如LLaMA系列进行指令微调,训练的损失函数是什么?在验证集上计算损失跟训练集上是否一致,谢谢!

在基于语言模型进行错误检测过程中,使用平均绝对离差方式进行识别,y_score = ratio * margin_median / med_abs_deviation 这个的作用是什么?ration这个参数代表什么意思?谢谢!

question

请问在指令微调时损失函数与预训练有什么区别吗?指令微调也是根据前文预测下一个token的概率吗?