FastTextRank 句子相似度计算公式的问题

句子相似度计算公式的问题

Open nickeyff opened this issue 6 years ago • 2 comments

大佬你好，当前句子计算公式是交集/log(len(A)+len(b))，这样的话，会不会导致句子越长，得到的相似度越高啊？

Nov 20 '19 02:11 nickeyff

相反，这个公式的目的就是为了削弱句子长度代码的影响，所以才除两个句子的长度来进行归一化。具体的原因可以见原始paper

May 04 '20 14:05 wangdh15

相反，这个公式的目的就是为了削弱句子长度代码的影响，所以才除两个句子的长度来进行归一化。具体的原因可以见原始paper

请问一下这个原始Paper是哪个？

Jun 05 '20 01:06 sportzhang