Junhua Ma

Results 37 comments of Junhua Ma

我们的代码开发和测试都是基于Unix/Linux的系统,没有针对windows开发,可能确实在windows上面会有一些问题,您可以试试换到linux上。windows的兼容问题我们会在之后争取解决:)

非常感谢反馈!windows的编码问题我们会提上日程解决~

感谢您的反馈,确实是测试没跑过,之前写的测试用例所用的数据因为版权问题删去了,所以测试通不过。这次我们将那些需要版权数据的测试用例删去了,可以编译并测试通过了

感谢您对THULAC的支持,目前并不可以,首先我们的提供的模型是中文的。其次即使自己训练模型,训练文本中词与词是以空格区别的,而英语短语每个词中都有空格,和我们的程序逻辑不搭,所以没办法用我们的程序跑

感谢您对thulac的支持,这是pip版的bug,我们会尽快更新。您可以先下载我们github页面上的版本使用

您好,在1.2 接口参数部分有说明

感谢您对THULAC的支持。现在THULAC对于大文件的处理还有欠缺,所以待处理文件特别大时会报内存错误,我们会尽快处理

您这边可以提供一下数据大小和您本机的内存大小么,我们参考下。另外c++命令行的文件读取分词是按行读取的,不会有内存问题,您可以先试试那个。

您有将models文件夹放在项目根目录么

我们更新了python版,之前确实有点问题,现在调用.so应该可以了。