Shen Yanchao

Results 6 comments of Shen Yanchao

拼音串切分比较难做到最好,我最近pull request的代码,能解决你这个问题。可以取最新的看看

已经修复。取end_offset为中文长度2

ignore_pinyin_offset=false,就有了

tokenizer为xmjt,然后在使用token_filter,比如EdgeNgram也许是更好的选择

@TeriMoni 这个还是建议你业务上定制公司名的简写最好。实在不行,先分成拼音再切分也是OK,不过可能有误召回

include_directories (${PROJECT_SOURCE_DIR} ${PROJECT_SOURCE_DIR}/3rdparty /usr/local/include # 指向有glog的目录 ) link_directories(/usr/local/lib) # 指向有dylib的目录 hope this helpful