FlagEmbedding
FlagEmbedding copied to clipboard
请问构造微调时,如果语料中一些query无对应的“正样本”可以怎样构建训练集
描述下我遇到的问题: 在做检索的时候,我设置了一个阈值,但是在这个阈值下,有时候召回的文本不是特别相关,我想通过训练去降低这部分文本与query之间的相似度,但是库中又没有比较好的正例
请问,训练时是否可能把pos设置为空数组呢? 或者,我是不是也可以用一些重写等方式,根据原始query造一些正例出来,然后构造训练集,这样能够达到我的目的吗?
训练时pos是必须有的 可以考虑用LLM为query造一些正例进行训练