FlagEmbedding
FlagEmbedding copied to clipboard
如何获得蒸馏分数进行微调?
想请问一下我想进行蒸馏微调reranker,如何构造对应的微调数据集,获得相应的 teacher_scores 。我打算利用大模型得到这个分数,构造出来的分数需要满足什么要求?必须进行归一化后在 【0-1】吗?
这个分数不需要进行归一化的,在训练中会用softmax后的分数作为蒸馏标准的
对于 蒸馏分数 有什么具体要求吗? 我看example_data 里的 分数都是 0-100?
这个分数不需要进行归一化的,在训练中会用softmax后的分数作为蒸馏标准的
由于我的蒸馏分数是自己设计的,所以我自己归一化到【0-1】了,请问有什么影响吗?即我的微调数据集中的分数都是0-1