analysis-pinyin
analysis-pinyin copied to clipboard
pinyin要如何配置才能处理多音字?
例如“银行”分析出来的是"yinxing"而不是预期的"yinhang".希望作者能在readme里加上说明和使用方法。
通过测试分析器得到的结果虽然是yinxing,但实际在查询是能通过yinhang来搜索的。
curl -XPOST http://10.18.100.207:9200/test_pinyin_and_ik_analyzer/folks/yinhang -d'{"content":"银行"}'
curl -XPOST http://10.18.100.206:9200/test_pinyin_and_ik_analyzer/folks/_search -d'
{
"query" : { "match" : { "content" : "hang" }},
"highlight" : {
"pre_tags" : ["<tag1>", "<tag2>"],
"post_tags" : ["</tag1>", "</tag2>"],
"fields" : {
"content" : {}
}
}
}
'
{"took":6,"timed_out":false,"_shards":{"total":5,"successful":5,"failed":0},"hits":{"total":1,"max_score":0.3594392,"hits":[{"_index":"test_pinyin_and_ik_analyzer","_type":"folks","_id":"yinhang","_score":0.3594392,"_source":{"content":"银行"},"highlight":{"content":["<tag1>银行</tag1>"]}}]}}
对多数多音字的热门词汇是能够在搜索时时识别的,但对于姓的多音字似乎还不行,像仇,覃这些多音字还搜不出来。
词典里面可以加上这个歧义词