analysis-ik icon indicating copy to clipboard operation
analysis-ik copied to clipboard

添加同义词之后,ik_smart 返回 ik_max_word 的分词

Open LvChengbin opened this issue 1 year ago • 1 comments

我自定义了两个 analyzer,一个使用 ik_max_word 最为 tokenizer,另一个使用 ik_smart 作为 tokenizer,其他设置完全相同,大概如下:

{
    analyzer : {
            ik_analyzer_synonyms_max_word : {
                type : 'custom',
                tokenizer : 'ik_max_word',
                filter : [
                    'ik_synonyms_graph_filter'
                ]
            },
            ik_analyzer_synonyms_smart : {
                type : 'custom',
                tokenizer : 'ik_smart',
                filter : [
                    'ik_synonyms_graph_filter'
                ]
            }
    }
}

对于同一个 Query,ik_smartik_max_word 的分词结果是差别很大的,但是使用我上面定义的两个 analyzer 时,分词结果是相同的,看起来都是使用 ik_max_word 分词之后再映射的同义词。

是我的配置有问题么?

=================

补充一下,不完全一样,使用 ik_smart 的分词结果还是更精炼一些,但是还是把一些词给分的更细了,暂时没看出来到底是什么逻辑。

LvChengbin avatar Nov 21 '23 12:11 LvChengbin