THULAC icon indicating copy to clipboard operation
THULAC copied to clipboard

An Efficient Lexical Analyzer for Chinese

Results 31 THULAC issues
Sort by recently updated
recently updated
newest added

数据量才500K,修改-b 后依然出现这个提示

打开警告选项 红字满天飞 默认执行还会coredump

Description:修改编译报错:undefined reference to `pthread_create' RootCause:Null Solution:

您好! 我提了一个PR,是C++版本的golang封装 希望为自然语言处理开源事业做贡献。

你好请问一下,算法原理是用 的什么模型,各个版本一样么? 我看python版本的好像用的crf,c++版本的呢? 我在网上找的资料有的说用的是结构化感知机,比较迷惑,求指导

您好,我在使用这个工具的过程中,发现有些自定义的分词不起作用,比如这句话: "最近,勇士老将伊戈达拉道出了实情!", 分词结果是 "勇士/老将/伊戈达拉道/出了/实情", 我自定了“道出了”, 但是貌似分词并没有起作用,结果还是将“伊戈达拉道”分成了一个词。请问这是什么原因?谢谢~

我按照文档导入到工程中后,头文件里有很多 error: multiple definition of `thulac::operator>>(std::istream&, int&)' 类似的错误。

请问有没有可能支持多线程分词?就是Model只加载一次,然后多个线程分别对不同的分本进行处理?

When the training_file is large, the training process cannot move on. The terminal shows: train_c: malloc.c:2369: sysmalloc: Assertion `(old_top == (((mbinptr) (((char *) &((av)->bins[((1) - 1) * 2])) - __builtin_offsetof...