FastTextRank
FastTextRank copied to clipboard
句子相似度计算公式的问题
大佬你好,当前句子计算公式是 交集/log(len(A)+len(b)),这样的话,会不会导致句子越长,得到的相似度越高啊?
相反,这个公式的目的就是为了削弱句子长度代码的影响,所以才除两个句子的长度来进行归一化。 具体的原因可以见原始paper
相反,这个公式的目的就是为了削弱句子长度代码的影响,所以才除两个句子的长度来进行归一化。 具体的原因可以见原始paper
请问一下这个原始Paper是哪个?