Word2Vec icon indicating copy to clipboard operation
Word2Vec copied to clipboard

对 ansj 编写的 Word2VEC_java 的进一步包装,同时实现了常用的词语相似度和句子相似度计算。

Results 4 Word2Vec issues
Sort by recently updated
recently updated
newest added

请问 如果要适配大多数其他国家的语言,要怎么做? 是要自己找到语料库,然后训练? 不同国家,分词方法还不一样吗?

如何训练java版的模型(是否还有做分词),得需要多大的语料库呢? 想做某个受限领域内的问答系统,因为语料库比较少,可以用这个模型来搞么?(感谢回答)

你的例子猫和狗的相似度是0.0 ![image](https://user-images.githubusercontent.com/5687626/40361449-f523edba-5dfb-11e8-96ce-776f75d42909.png)

Word2Vec.trainJavaModel("data/train.txt", "data/test.model"); 你好, data/train.txt 和 data/test.model 能给个样例吗。 例如:我有10句话,分词之后,在train.txt是什么样子的。 把相近的词空格分开,放到同一行? 还是10句话,一句一行,词用空格