FlagEmbedding
FlagEmbedding copied to clipboard
Tutorial的一处错误
这里第1、2句是不相似的,1、3句是相似的
但这里只有第二个欧几里得距离是满足1、3句更加相似。然而最后的总结句也是错误的。
我运行了代码,第三个cos距离确实是产生了相反结果。
这是否也从侧面说明了光看角度是不行的?或许embedding向量本身就需要用长度来标志某些信息
感谢指出问题! 余弦相似度的值越大,相似度越高,但相反欧几里得距离越大相似度越低,所以这里的欧几里得距离也不满足1、3句更相似。这里的问题是base模型还是没有很好地理解这三句话的语义。新的commit中,模型bge-large-en-v1.5能正确地分辨这三句的相似性