THULAC-Python icon indicating copy to clipboard operation
THULAC-Python copied to clipboard

您好,如果我想对英文文本进行分词,并识别出其中的短语,可以实现吗?

Open GoodKeyboad opened this issue 8 years ago • 1 comments

GoodKeyboad avatar Sep 26 '17 08:09 GoodKeyboad

感谢您对THULAC的支持,目前并不可以,首先我们的提供的模型是中文的。其次即使自己训练模型,训练文本中词与词是以空格区别的,而英语短语每个词中都有空格,和我们的程序逻辑不搭,所以没办法用我们的程序跑

MaJunhua avatar Sep 29 '17 17:09 MaJunhua