FlagEmbedding
FlagEmbedding copied to clipboard
多条正样本
你好,我想请问一下,如果我的数据集中,每个query有很多正样本,应该怎么训练?如果正样本数量非常多,负样本应该如何选择?如果不同query有多个正样本,而且正样本的数目差异很大,应该如何构建数据集并训练?