FlagEmbedding
FlagEmbedding copied to clipboard
bge-large-zh微调大致需要多少数据量?
几千条大致就能微调,不过高质量数据越多越好。
几千条大致就能微调,不过高质量数据越多越好。
好的,谢谢。请问pos和neg的数量有什么讲究吗?
没有讲究。neg的数量最好大于train_group_size参数,这样避免因为neg太少导致对同一个neg重复采样