FlagEmbedding icon indicating copy to clipboard operation
FlagEmbedding copied to clipboard

相似句对标准问题的相似度分数差距较大

Open yanghao-97 opened this issue 1 year ago • 1 comments

使用相同的模型,对其进行向量化,计算余弦相似度。两个非常相似的用户问题,对相同的标准问题的相似度分数差距较大。 比如: 标准问题:境内差旅住宿标准 用户问题1:出差住宿标准(0.902) 用户问题2:我的出差住宿标准(0.835)

请问上述问题大概是由于什么造成的?或者有什么好的解决方案吗?

yanghao-97 avatar Mar 18 '24 07:03 yanghao-97

您好,推荐使用新版模型bge-m3。稠密向量和以前的bge一样 的使用方式

staoxiao avatar Mar 18 '24 10:03 staoxiao