FastTextRank icon indicating copy to clipboard operation
FastTextRank copied to clipboard

句子相似度计算公式的问题

Open nickeyff opened this issue 4 years ago • 2 comments

大佬你好,当前句子计算公式是 交集/log(len(A)+len(b)),这样的话,会不会导致句子越长,得到的相似度越高啊?

nickeyff avatar Nov 20 '19 02:11 nickeyff

相反,这个公式的目的就是为了削弱句子长度代码的影响,所以才除两个句子的长度来进行归一化。 具体的原因可以见原始paper

wangdh15 avatar May 04 '20 14:05 wangdh15

相反,这个公式的目的就是为了削弱句子长度代码的影响,所以才除两个句子的长度来进行归一化。 具体的原因可以见原始paper

请问一下这个原始Paper是哪个?

sportzhang avatar Jun 05 '20 01:06 sportzhang