关于性能问题?
windows 10 python3.6.4 thulac (0.1.2) 实际分词速度差不多是jieba分词的 1% 使用的是demo上的方法,不进行词性标注
感谢对THULAC的支持,由于我们的模型使用的是CRF模型,与jieba相比模型更为庞大
我们在报告中所提到的速度是使用thulac c++版进行测试的
如果使用python,可以调用fast_*函数进行大规模使用和测试
在 2018年4月16日,下午11:19,黎谢鹏 <[email protected] mailto:[email protected]> 写道:
windows 10 python3.6.4 thulac (0.1.2) 实际分词速度差不多是jieba分词的 1% 使用的是demo上的方法,不进行词性标注
— You are receiving this because you are subscribed to this thread. Reply to this email directly, view it on GitHub https://github.com/thunlp/THULAC-Python/issues/69, or mute the thread https://github.com/notifications/unsubscribe-auth/AL1GvcLuX3diHnYVycxwwA8ynIsLGtgSks5tpLaagaJpZM4TWvTb.
试了一些case,感觉你们的效果比结巴差的明显啊,比如如下两个例子(您别告诉我是碰巧~) “江州市长江大桥参加了长江大桥通车典礼” “大连美容美发学校中君意是你值得信赖的选择”
试了一些case,感觉你们的效果比结巴差的明显啊,比如如下两个例子(您别告诉我是碰巧~) “江州市长江大桥参加了长江大桥通车典礼” “大连美容美发学校中君意是你值得信赖的选择”
哈哈,人读的也费劲