Junhua Ma
Junhua Ma
感谢您对thulac的支持,由于我们之前的开发没有针对windows进行,所以Windows上面python2.7兼容目前有些问题。不过从之前的反馈来看,windows上python3.6不会有这个问题
感谢您对THULAC的支持,如果是对一个长文本进行多线程分词,您可以试一下 THULAC_result& multiTreadCut(const std::string &in, THULAC& lac, int thread);输入一个待分词和词性标注的字符串,一个THULAC实例,线程数,返回THULAC_result类型变量 如果是对多个文本进行分词,目前我们没有封装,您可以自行创建thread多次调用cut函数~
感谢您对THULAC的支持,由于分词过程会在内存中新建一些变量,所以字符串太长可能会爆内存。您可以先以一定长度对字符串先进行切分,再分词。我们近期也争取加入长字符串的cut函数。
感谢您对THULAC的支持,请您发一下运行环境(系统和python版本),具体的报错提示,以及用的哪个函数
这个应该是运行.so文件崩溃了,您可以试试编译下THULAC(c++)版,再用那里的.so文件试试。还是不行可以先看看能不能运行c++版本,看是不是c++编译的问题
我们开发的时候也会用pycharm调试啊,好像没有问题?
感谢您对THULAC的支持, 这个功能确实有必要,我们刚才更新了接口,给模型初始化添加了rm_space参数,为False时不去除空格,应该可以解决您的问题,