python-pinyin icon indicating copy to clipboard operation
python-pinyin copied to clipboard

拼音到汉字的转换

Open codemayq opened this issue 5 years ago • 7 comments

运行环境

问题描述

是否能支持,输入拼音,给出所有可能的汉字、词组的功能

问题复现步骤

codemayq avatar Sep 10 '19 03:09 codemayq

目前不支持。后面有空的时候可能会支持这个功能。如果你有兴趣来实现这个功能的话,欢迎提交 PR 或者创建一个新的实现这个功能的模块/库/包。

mozillazg avatar Sep 10 '19 12:09 mozillazg

这就是另外一个很大很复杂的项目了。类似于一个输入法,要将短语或句子级的拼音串转为汉字,肯定要用到语言模型。

yaleimeng avatar Jan 03 '20 07:01 yaleimeng

我有个开源的整句引擎,是目前我自己输入法在用的,开源的刚好是Python版,必要的话可以拿来用啊

R0uter avatar Nov 22 '20 12:11 R0uter

@R0uter 感谢分享,很有用。

yaleimeng avatar Dec 01 '20 00:12 yaleimeng

@R0uter 可以分享下吗? 谢谢

someoneyoulike avatar Oct 30 '21 11:10 someoneyoulike

@someoneyoulike 你点击它头像或用户名就可以看到他的代码库了啊。。 他所说的项目叫落格输入法。 玩一玩没问题,别抱太高期望就行。

yaleimeng avatar Jan 25 '22 00:01 yaleimeng

@someoneyoulike https://github.com/R0uter/LoginputEngine 代码和实现完全开源,你需要就拿去用,唯一的缺点大概就是不支持变长组合……不过开源的引擎部分好像没包含拼音拆分,这个你得自己去研究,我目前也就是简单的使用最长匹配,接下来打算用 transformer 之类的模型炼一波,还在研究中。最近把算法换到了 KenLM,直接用它生成的 arpa,准确度不变的情况下,训练速度更快。

@yaleimeng 你的评价我不认同,至少也是生产环境级别的算法和实现呢……😬

R0uter avatar Jan 25 '22 01:01 R0uter