learning-nlp
learning-nlp copied to clipboard
第七章 doc2vec复现相似度结果 0.64,没有书中的0.87
数据: 1.模型:用的是书中作者提供的训练好的模型文件,百度网盘下载的。 2.测试数据:用的同样的 3.代码:直接用的GitHub的 请问是我哪些细节我没有注意到吗?谢谢!
还有一个疑问:书中doc2vec训练代码 size = 200,而GitHub下载的代码中 size = 192,请问这个是有什么区别吗? 谢谢!
已收到您的邮件,谢谢。
您好,我后面发现了可能的原因所在: 我在测试中,调整了学习率和迭代次数,对应的两个向量的余弦相似度会产生很大的变化。