pinyin
pinyin copied to clipboard
The high performance pinyin tool for java.(java 高性能中文转拼音工具。支持同音字。)
猜测是否为生成JAR包后读取不到/pinyin_dict_char.txt文件,后改为lib分离打包的形式后解决 Exception in thread "mainTimerThread" java.lang.ExceptionInInitializerError at com.github.houbb.pinyin.bs.PinyinBs.(PinyinBs.java:76) at com.github.houbb.pinyin.bs.PinyinBs.newInstance(PinyinBs.java:90) at com.github.houbb.pinyin.util.PinyinHelper.(PinyinHelper.java:32) at com.txht.service.ForecastService.getWeather(ForecastService.java:85) at com.txht.service.ForecastService.doGrab(ForecastService.java:61) at com.txht.task.MyTimerTask$workTimerTask.run(MyTimerTask.java:32) at java.util.TimerThread.mainLoop(Timer.java:555) at java.util.TimerThread.run(Timer.java:505) Caused by: java.lang.ArrayIndexOutOfBoundsException: 1 at com.github.houbb.pinyin.support.tone.PinyinToneReverse.(PinyinToneReverse.java:52) ... 8...
比如单田芳,转换出来是dantianfang 比如仇做姓氏应该读作qiu
貌似在Pinyin.toPinyinList中会将非中文单词直接原封不动的加上
暂时发现了两处system.out 一个是[Pinyin] 另一个是[NLP] 的日志输出
我测试了一下 `吃重庆火锅` 这句话,pinyin4j 给出了正确结果,这个库会把重转换成 `zhong4`。可能是因为错误的分词?
是否有选项可以把ü打出来,好像目前都用的u,试了下pinyin4j也是有部分问题,他在处理“吕”的时候是正常的,但是在处理“句”这种其实是省略两点的ü也是会认为是u。 希望大佬可以处理下
在客户端上使用这个依赖的时候发现了几个比较大的库,这些库能否通过远程下载的方式挂靠上去呢 "/nlp/word_freq_dict.txt" 1.8MB "/pinyin_dict_phrase.txt" 444KB "/pinyin_dict_char.txt" 200KB