jimi
jimi
开源 != 免费劳动力吧,啥时候更新是作者自由,有空就更新,没空就不更新。 您要是实在有什么需求,两个选择:要么自己研究代码,要么付费给开源作者,对不?
开源 != 免费劳动力吧,啥时候更新是作者自由,有空就更新,没空就不更新。 您要是实在有什么需求,两个选择:要么自己研究代码,要么付费给开源作者,对不?
开玩笑的:) 开源不易,且用且珍惜
我在mynlp项目中, 人名97% 地名未知语料不多
应该是在viterbi求最优路径时,计算权重会用到吧
数值改的太小没啥作用,1000一个单位范围调整试试。现在这个我也不太熟悉了,愿意的话可以试试我自己搞的mynlp项目
```java MemCustomDictionary memCustomDictionary = new MemCustomDictionary(); FluentLexerBuilder builder = Lexers.coreBuilder(); builder.with(new CustomDictionaryPlugin(memCustomDictionary)); Lexer tokenizer = builder.build(); System.out.println(tokenizer); System.out.println(tokenizer.scan("欢迎来到松江临港科技城")); memCustomDictionary.addWord("临港科技城"); memCustomDictionary.rebuild(); System.out.println(tokenizer.scan("欢迎来到松江临港科技城")); ``` Output: ```text PipelineTokenizer BestPathAlgorithm = ViterbiBestPathAlgorithm CharNormalize =...
感知机的确有这样的不确定性,你可以把原文给我测试,考虑加入一些规则进去
hanlp有个你可以试试,应该是基于HMM的,也加了很多规则了, 有时间您可以对比一下
我本地把maven缓存清理重新下载测试没问题,你检查一下你的maven本地仓库中mynlp.jar是否完整,大小应该在1M左右