相似句对标准问题的相似度分数差距较大

Open yanghao-97 opened this issue 1 year ago • 1 comments

使用相同的模型，对其进行向量化，计算余弦相似度。两个非常相似的用户问题，对相同的标准问题的相似度分数差距较大。比如：标准问题：境内差旅住宿标准用户问题1：出差住宿标准（0.902）用户问题2：我的出差住宿标准（0.835）

请问上述问题大概是由于什么造成的？或者有什么好的解决方案吗?

Mar 18 '24 07:03 yanghao-97

您好，推荐使用新版模型bge-m3。稠密向量和以前的bge一样的使用方式

Mar 18 '24 10:03 staoxiao