Word2Vec
Word2Vec copied to clipboard
对 ansj 编写的 Word2VEC_java 的进一步包装,同时实现了常用的词语相似度和句子相似度计算。
请问 如果要适配大多数其他国家的语言,要怎么做? 是要自己找到语料库,然后训练? 不同国家,分词方法还不一样吗?
如何训练java版的模型(是否还有做分词),得需要多大的语料库呢? 想做某个受限领域内的问答系统,因为语料库比较少,可以用这个模型来搞么?(感谢回答)
例子都跑不通
你的例子猫和狗的相似度是0.0 
怎么训练模型
Word2Vec.trainJavaModel("data/train.txt", "data/test.model"); 你好, data/train.txt 和 data/test.model 能给个样例吗。 例如:我有10句话,分词之后,在train.txt是什么样子的。 把相近的词空格分开,放到同一行? 还是10句话,一句一行,词用空格