THULAC-Python icon indicating copy to clipboard operation
THULAC-Python copied to clipboard

关于性能问题?

Open XiepengLi opened this issue 7 years ago • 3 comments

windows 10 python3.6.4 thulac (0.1.2) 实际分词速度差不多是jieba分词的 1% 使用的是demo上的方法,不进行词性标注

XiepengLi avatar Apr 16 '18 15:04 XiepengLi

感谢对THULAC的支持,由于我们的模型使用的是CRF模型,与jieba相比模型更为庞大

我们在报告中所提到的速度是使用thulac c++版进行测试的

如果使用python,可以调用fast_*函数进行大规模使用和测试

在 2018年4月16日,下午11:19,黎谢鹏 <[email protected] mailto:[email protected]> 写道:

windows 10 python3.6.4 thulac (0.1.2) 实际分词速度差不多是jieba分词的 1% 使用的是demo上的方法,不进行词性标注

— You are receiving this because you are subscribed to this thread. Reply to this email directly, view it on GitHub https://github.com/thunlp/THULAC-Python/issues/69, or mute the thread https://github.com/notifications/unsubscribe-auth/AL1GvcLuX3diHnYVycxwwA8ynIsLGtgSks5tpLaagaJpZM4TWvTb.

gzp9595 avatar Apr 16 '18 15:04 gzp9595

试了一些case,感觉你们的效果比结巴差的明显啊,比如如下两个例子(您别告诉我是碰巧~) “江州市长江大桥参加了长江大桥通车典礼” “大连美容美发学校中君意是你值得信赖的选择”

zhenghaor10 avatar May 06 '18 08:05 zhenghaor10

试了一些case,感觉你们的效果比结巴差的明显啊,比如如下两个例子(您别告诉我是碰巧~) “江州市长江大桥参加了长江大桥通车典礼” “大连美容美发学校中君意是你值得信赖的选择”

哈哈,人读的也费劲

singingplayer avatar Jan 27 '19 09:01 singingplayer