analysis-ik
analysis-ik copied to clipboard
添加同义词之后,ik_smart 返回 ik_max_word 的分词
我自定义了两个 analyzer,一个使用 ik_max_word
最为 tokenizer,另一个使用 ik_smart
作为 tokenizer,其他设置完全相同,大概如下:
{
analyzer : {
ik_analyzer_synonyms_max_word : {
type : 'custom',
tokenizer : 'ik_max_word',
filter : [
'ik_synonyms_graph_filter'
]
},
ik_analyzer_synonyms_smart : {
type : 'custom',
tokenizer : 'ik_smart',
filter : [
'ik_synonyms_graph_filter'
]
}
}
}
对于同一个 Query,ik_smart
和 ik_max_word
的分词结果是差别很大的,但是使用我上面定义的两个 analyzer 时,分词结果是相同的,看起来都是使用 ik_max_word
分词之后再映射的同义词。
是我的配置有问题么?
=================
补充一下,不完全一样,使用 ik_smart
的分词结果还是更精炼一些,但是还是把一些词给分的更细了,暂时没看出来到底是什么逻辑。