learning-nlp icon indicating copy to clipboard operation
learning-nlp copied to clipboard

第七章 doc2vec复现相似度结果 0.64,没有书中的0.87

Open hiccuplp opened this issue 2 years ago • 2 comments

数据: 1.模型:用的是书中作者提供的训练好的模型文件,百度网盘下载的。 2.测试数据:用的同样的 3.代码:直接用的GitHub的 请问是我哪些细节我没有注意到吗?谢谢!

还有一个疑问:书中doc2vec训练代码 size = 200,而GitHub下载的代码中 size = 192,请问这个是有什么区别吗? 谢谢!

hiccuplp avatar Aug 20 '22 02:08 hiccuplp

 已收到您的邮件,谢谢。

kangyuqi avatar Aug 20 '22 02:08 kangyuqi

您好,我后面发现了可能的原因所在: 我在测试中,调整了学习率和迭代次数,对应的两个向量的余弦相似度会产生很大的变化。

hiccuplp avatar Aug 22 '22 02:08 hiccuplp