THULAC-Python
THULAC-Python copied to clipboard
关于分词的时候自动去除空格
输入:
而荔 波 肉又 丧 心 病 狂 的不肯悔改
输出:
而_c 荔_v 波_n 肉_n 又_d 丧心病狂_i 的_u 不_d 肯_v 悔改_v
工具对文本的空格去除后,再进行分词。但我现在的任务不希望去除空格。 请问怎么设置可以不去除空格,直接分词?
感谢您对THULAC的支持, 这个功能确实有必要,我们刚才更新了接口,给模型初始化添加了rm_space参数,为False时不去除空格,应该可以解决您的问题,
谢谢