Word2Vec icon indicating copy to clipboard operation
Word2Vec copied to clipboard

适配其他国家的语言

Open DorisGM opened this issue 5 years ago • 2 comments

请问 如果要适配大多数其他国家的语言,要怎么做?

是要自己找到语料库,然后训练? 不同国家,分词方法还不一样吗?

DorisGM avatar Mar 15 '19 11:03 DorisGM

你好,Word2Vec 是一个语言模型,词向量只是副产物。对于任意一种语言,词向量都需要通过在大量语料上训练来得到。分词主要针对中文(因为中文词与词之间没有分隔符),英语直接用空格分都分得差不多了。

jsksxs360 avatar Mar 17 '19 06:03 jsksxs360

好的 谢谢解答。

DorisGM avatar Mar 18 '19 01:03 DorisGM