dazhaxie0526 issues

Results 3 issues of


                                            dazhaxie0526

基于基座模型比如LLaMA系列进行指令微调，训练的损失函数是什么？在验证集上计算损失跟训练集上是否一致，谢谢！

在基于语言模型进行错误检测过程中，使用平均绝对离差方式进行识别，y_score = ratio * margin_median / med_abs_deviation 这个的作用是什么？ration这个参数代表什么意思？谢谢！

question

请问在指令微调时损失函数与预训练有什么区别吗？指令微调也是根据前文预测下一个token的概率吗？