analysis-ik
analysis-ik copied to clipboard
分词后搜索 两个连接词比如爱情小狗,搜索情小搜索不到
一个短语,爱情小狗,分词策略ik_max_word,分成了两个词,爱情 小狗,如果搜索情小,无法搜索到,如何解决?或者说搜索不到是正常的?该案例用到一个文档搜索器中
爱情小狗 分词 -> 爱情 小狗
情小 分词 -> 情 小
所以情小是无法匹配爱情小狗的
解决方案:最简单最省事的是:把所有的汉子单字作为一个词典库,这样ik_max_word
分词后就变成: 爱情 爱 情 小狗 小 狗
输入情小后肯定能匹配到
缺点是:分词逻辑被打乱,需要对关键词的输入做处理才能拿去搜索
还有就是配置同义词:
爱,情 => 爱情
小,狗 => 小狗
这样也能实现,不过统计同义词这个工作量就比较繁杂
用 wildcard
。。。