elasticsearch-analysis-ansj icon indicating copy to clipboard operation
elasticsearch-analysis-ansj copied to clipboard

修改默认词库,为什么有的生效,有的不生效

Open zhmfan opened this issue 7 years ago • 7 comments

将词库中的"苏州市" 去掉,分词还是分词了 苏州市 但是将 “苏州市委”去掉,分词就可以分成 苏州 市委 请问这种是什么规则,怎么修改,谢谢

zhmfan avatar Dec 13 '18 07:12 zhmfan

可以配置歧义词

shi-yuan avatar Dec 14 '18 02:12 shi-yuan

@shi-yuan 谢谢,确实可以解决,万分感谢 麻烦再问一下,同义词的dic内容格式是怎么样的啊

zhmfan avatar Dec 14 '18 05:12 zhmfan

https://github.com/NLPchina/ansj_seg/blob/master/library/synonyms.dic

shi-yuan avatar Dec 14 '18 06:12 shi-yuan

还要请教作者一个问题,词库中 有 大爱 戴德 爱戴 ”大爱戴德“ 分词分成了 “大 爱戴 德” 我修改词库词权重 无法 将 “大爱戴德” 分成 “大爱 戴德” 请问这种情况该如何处理啊

zhmfan avatar Dec 27 '18 01:12 zhmfan

用dicanalysis 或者用 歧义词典

ansjsun avatar Dec 27 '18 02:12 ansjsun

还是歧义词吧

shi-yuan avatar Dec 27 '18 03:12 shi-yuan

用dic_ansj的话,升级下ansj_seg的包到5.1.6哈

shi-yuan avatar Dec 27 '18 03:12 shi-yuan