analysis-pinyin
analysis-pinyin copied to clipboard
liyanan => tokenizer wrong
liyanan => li ya nan liyanan => li yan an
目前只能出一个结果。毕竟这俩你都不能算错。我感觉可以有这几种方法:1 : 人工切分查两次 2: 修改源码冗余编码,不过冗余编码以后不能使用match_phrase了倒是真的
目前只能出一个结果。毕竟这俩你都不能算错。我感觉可以有这几种方法:1 : 人工切分查两次 2: 修改源码冗余编码,不过冗余编码以后不能使用match_phrase了倒是真的
那我想问一下,假设拼音特意采用空格分隔,如:ying lun mi an,通过拼音分词能分成ying lun mi an,而不是现在的ying lun mian把mi和an黏在了一块