python-pinyin
python-pinyin copied to clipboard
拼音到汉字的转换
运行环境
问题描述
是否能支持,输入拼音,给出所有可能的汉字、词组的功能
问题复现步骤
目前不支持。后面有空的时候可能会支持这个功能。如果你有兴趣来实现这个功能的话,欢迎提交 PR 或者创建一个新的实现这个功能的模块/库/包。
这就是另外一个很大很复杂的项目了。类似于一个输入法,要将短语或句子级的拼音串转为汉字,肯定要用到语言模型。
我有个开源的整句引擎,是目前我自己输入法在用的,开源的刚好是Python版,必要的话可以拿来用啊
@R0uter 感谢分享,很有用。
@R0uter 可以分享下吗? 谢谢
@someoneyoulike 你点击它头像或用户名就可以看到他的代码库了啊。。 他所说的项目叫落格输入法。 玩一玩没问题,别抱太高期望就行。
@someoneyoulike https://github.com/R0uter/LoginputEngine 代码和实现完全开源,你需要就拿去用,唯一的缺点大概就是不支持变长组合……不过开源的引擎部分好像没包含拼音拆分,这个你得自己去研究,我目前也就是简单的使用最长匹配,接下来打算用 transformer 之类的模型炼一波,还在研究中。最近把算法换到了 KenLM,直接用它生成的 arpa,准确度不变的情况下,训练速度更快。
@yaleimeng 你的评价我不认同,至少也是生产环境级别的算法和实现呢……😬