Junhua Ma

[email protected]

北京邮电大学

Results 37 comments of


                                            Junhua Ma

编译test_case.cpp时头文件出错

我们的代码开发和测试都是基于Unix/Linux的系统，没有针对windows开发，可能确实在windows上面会有一些问题，您可以试试换到linux上。windows的兼容问题我们会在之后争取解决:)

编译test_case.cpp时头文件出错

非常感谢反馈！windows的编码问题我们会提上日程解决~

您好，我在尝试编译源码的时候遇到了一些问题

感谢您的反馈，确实是测试没跑过，之前写的测试用例所用的数据因为版权问题删去了，所以测试通不过。这次我们将那些需要版权数据的测试用例删去了，可以编译并测试通过了

您好，如果我想对英文文本进行分词，并识别出其中的短语，可以实现吗？

感谢您对THULAC的支持，目前并不可以，首先我们的提供的模型是中文的。其次即使自己训练模型，训练文本中词与词是以空格区别的，而英语短语每个词中都有空格，和我们的程序逻辑不搭，所以没办法用我们的程序跑

TypeError: reduce() of empty sequence with no initial value

感谢您对thulac的支持，这是pip版的bug，我们会尽快更新。您可以先下载我们github页面上的版本使用

导入外部词典的问题

您好，在1.2 接口参数部分有说明

make成功后，运行thulac报Segmentation fault (core dumped)

感谢您对THULAC的支持。现在THULAC对于大文件的处理还有欠缺，所以待处理文件特别大时会报内存错误，我们会尽快处理

make成功后，运行thulac报Segmentation fault (core dumped)

您这边可以提供一下数据大小和您本机的内存大小么，我们参考下。另外c++命令行的文件读取分词是按行读取的，不会有内存问题，您可以先试试那个。

make成功后，运行thulac报Segmentation fault (core dumped)

您有将models文件夹放在项目根目录么

make成功后，运行thulac报Segmentation fault (core dumped)

我们更新了python版，之前确实有点问题，现在调用.so应该可以了。

‹
1
2
3
4
›