Yanyi Wu
Yanyi Wu
哦,用法应该没啥问题,看来你这个词库数量级可能确实64G不够。。。
建议是清理一下词库,看上去是词库建设不太合理。
不太确定,或者是因为天气不好
现在试试,应该可以了
这个后来想了想,一般都需要二次封装。还是上层使用者按照需求自己封装吧,比如 Count 字段之类的。并不是都需要的。
如果熟悉 oc 的话应该很简单,我主要是不熟悉 oc ,不然像使用 MixSegment 一样去使用 PosTagger 做词性标注就行了。
不过建议词性标注这类 nlp 的任务还是在服务端做比较好。
我说的是这个 https://github.com/yanyiwu/iosjieba/blob/master/iosjieba/CppJieba/PosTagger.hpp
@Starfine 具体原因我也不知道,但是提醒一下,gojieba 底层是用 c++写的,在 linux 上表现没问题,在 windows 上可能有一些问题需要处理。
停用词是在关键词抽取Extractor 中会使用,分词本身不使用停用词。