Medcl

Results 67 comments of Medcl

can you try this: https://github.com/medcl/elasticsearch-analysis-mmseg/releases/tag/v5.2.2

有参数 `keep_none_chinese_together` 可以开启。

offset现在默认是忽略了,高亮的话需要开启。 ``` DELETE index333 PUT index333/ { "settings": { "analysis": {"analyzer": { "pinyin":{ "type":"pinyin", "ignore_pinyin_offset":false } }} }, "mappings": { "type":{ "properties": { "name":{ "type": "text", "analyzer": "pinyin" } }...

pinyin 如果产生多个重复的位置重叠的 term,本来就不适合 phrase 查询。换普通的查询应该是可以的,查询和索引都有分出 term:mec,应该可以查询出来的,

欢迎提交 PR 改进这一块的功能

这个歧义不太好处理,正确与否无法从 pingyin 层面得到支撑, ying lun mi an-> 英伦迷案/秘岸,或者ying lun mi an-》英伦棉/面 两种翻译,都毫无违和感。

包含setting和数据的完整的例子能发一下么? 另外,高亮可以选其它字段。

1.如果拼音分词的结果是多个位置叠加的 term,那么查询条件不应该同时命中这些term,所以这个字段的 search_analyzer 可以设置为 keyword 比较好; 2.命中和高亮的逻辑可以分开,使用另外一个字段,查询范围可以窄一点和准一点,高亮的时候用这个字段。