phrase-pinyin-data icon indicating copy to clipboard operation
phrase-pinyin-data copied to clipboard

词语拼音数据

Results 16 phrase-pinyin-data issues
Sort by recently updated
recently updated
newest added

![1635069007_grim](https://user-images.githubusercontent.com/54471528/138588965-f1228bf7-f77c-4ac1-843b-e5b2dd1efb43.png) 在“前传” “后传”等词中正确读音应该是zhuan

enhancement

由于我们把”地“字的默认拼音改为了更常用的 di4,测试发现几乎所有的轻声情况都没有准确地识别,不过总的来说轻声的情况很容易被词库覆盖。我从我的词库中筛选出了保留 ”de“ 发音的 6853 条包含”地“(de)常见词汇(短语),不过由于实在是没功夫校对,直接提 pr 不太合适,只好发 issues 了,希望各位帮忙校对。 其实就我自己来说,我觉得直接放入词库也影响不大,因为这些都是特殊情况,一般也不会被匹配到,何况考虑到之前 pypinyin 对 ”地“字的处理大多都是错的,所以……正确率只会提升不会下降hhhh 最后,我已经把词库按字数排序,方便开发者根据具体实现筛选词条,比如太长的就去掉不要好了(这样还能降低体积)。 ```淡地: dàn de 短地: duǎn de 嘀地: dí de 蹬地: dēng de 突地: tū de...

enhancement

能否给个方法提示,将.txt的字典文件中的拼音的音调去掉

![乌拉莫名轻声](https://user-images.githubusercontent.com/77195551/161764001-6a01edb2-711b-4d90-8e2e-356ce3ca10ff.png) 除此之外还有很多地方属于多音字的错用。不知道标音是人工识别还是AI自动识别的,但是如果使用Style.TONE3或TONE2把音调转化为各种a1/o3的形式,那么搜索"o "能比较有效率地找到更多轻声词的误用,以便改正。

@hotoo > 拼音库主要依赖的是拼音字典、词典(后面简称“词典”),这个词典共用性很高,但由于词典库较大,出现问题的概率的也高。 > > 建议大家一起共建、共同维护这个词典,你们觉得怎么样? > refer: https://github.com/mozillazg/python-pinyin/issues/43 字典在 https://github.com/mozillazg/pinyin-data 原始数据基于 https://github.com/hotoo/pinyin/blob/master/data/phrases-dict.js 数据格式: ``` {词语}: {音} {音} ``` 一行一个词语的读音,有多个音的词语可以再重复一行: ``` 朝阳: cháo yáng 朝阳: zhāo yáng ``` 完善数据参考资料: -...

1985年12月发布的 《普通话异读词审音表》 约定的 异读词读音规范 在这里面有体现吗? 比如:骑 约定 统读 为 qí,但是词语 轻骑简从 的 拼音还是 qīng jì jiǎn cóng

[“一”的变调](http://teacher.hschinese.com/knowledge/61) [“不”的变调](http://teacher.hschinese.com/knowledge/62) [上声的变调](http://teacher.hschinese.com/knowledge/64)

“得”的读法在下面应该是děi (感觉这是一个比较难的问题) ` pypinyin.pinyin('这个还得从头来。') ` ` [['zhè'], ['gè'], ['hái'], ['dé'], ['cóng'], ['tóu'], ['lái'], ['。']] ` ` pypinyin.pinyin('这个 还 得 从头来。') ` ` [['zhè'], ['gè'], [' '], ['hái'], [' '], ['dé'],...