FlagEmbedding
FlagEmbedding copied to clipboard
相似句对标准问题的相似度分数差距较大
使用相同的模型,对其进行向量化,计算余弦相似度。两个非常相似的用户问题,对相同的标准问题的相似度分数差距较大。 比如: 标准问题:境内差旅住宿标准 用户问题1:出差住宿标准(0.902) 用户问题2:我的出差住宿标准(0.835)
请问上述问题大概是由于什么造成的?或者有什么好的解决方案吗?
您好,推荐使用新版模型bge-m3。稠密向量和以前的bge一样 的使用方式