Shingo
Shingo
你好,我也有对 flypy_zrmfast.dict.yaml 这个文件是怎么生成的比较感兴趣,我想扩充词库,实现能在使用辅助码的同时可用外部大词库,主要困难是怎么生成辅助形码, 可否提供工具,参考链接,谢谢
感谢楼上 @functoreality 耐心实例讲解, 看起来确实有点小复杂, 大概尝试了一下,也确实遇到一些您提到的需要注意的问题。目前我主要使用小鹤双拼和它的的形码, 在网络上没搜到它的形码单字文件,您那边有吗,可否方便提供,谢谢。 另外我基于您的项目增加了双拼词库(没有形码),目前使用起来也还可以,在这里感谢您的付出🙏🏻,👍
> > > > 这个好像是有版权的,估计得逆向,可以看看openfly里面有没有。http://react.xhup.club/search 这里可以查 我找到了一个带形码的单字文件,也看到了 openfly 。 附上链接: https://github.com/zhuangzhemin/Rime/blob/master/flypy_chars.dict.yaml
> 我似乎记得外挂的码表可以只有文字部分,不写拼音,Rime 会根据单字的编码自动生成词组的编码,这样就不需要做复杂的码表转换。不过对有多音字的词组来说可能会稍微有些不方便。 好的,谢谢, 目前还在学习rime配置中,还在研究比较合适的方案
> 如果你(或者别人)写了一个更好用的转换程序也可以告诉我 https://github.com/boomker/rime-flypy-xhfast/blob/15664c597644bd41410ec4595cece88a6452a1bf/scripts/flypy_dict_generator_new.py https://github.com/boomker/rime-flypy-xhfast/blob/15664c597644bd41410ec4595cece88a6452a1bf/scripts/xhxm_map.py 目前支持 全拼拼音转小鹤双拼 、简拼,常见汉字转小鹤形码。 自然码我不用(没看到过官网,教程不全的样子), 我暂时不支持了,后面要用自然码方案的时候,再支持吧 脚本如果有bug ,可以联系我修
> @boomker 老哥真有执行力,不过这个码表似乎有问题,我用了几个非小鹤官方的方案发现的。 > > > > 威 这个字在小鹤官网查到的形码是 wwxn,而很多其他的方案给的确是你这个码表,我都不知道哪个是对的了 这个发现很有意思, 官网查到应该是正确的。可以参考其他例字: 严格来说,上图(来自小鹤官方)种“咸”的形码是`wk`, “戌” 里面的一横是连接的,“威, 咸”这两字里面的 '-'(横)是两端有空隙的
> 感谢,已更新 README。 我还没有完整地读一遍这份代码。里面似乎没有用到 opencc,不过如果外挂码表很多都是纯简体的码表的话,也确实不需要做繁简转换这一步。 PS:自然码双拼我是靠 Rime 拼写运算支持的,这部分不需要写到码表里面。如果是自然快手形码的话,我对它的规则的了解也仅限于 README 里的那张图😂 感谢大佬,暂时还没考虑繁体转简体, 我转换的词库来源雾凇拼音项目的词典文件,内容基本上是简体的
> 所以可能是这些衍生的码表来自比较早期的鹤形,而官方鹤形一直在更新 有可能, 也有可能是其他人在整理码表时,自己加上的形码 其实用什么形码,以及形码是否与官方一致不是那么重要,只要使用者对形码的编码能熟练使用,达到快速筛字上屏的目的即可
> win10上运行转换脚本出错, 麻烦大佬看下  我自己又新开一个仓库, 新仓库的脚本有更新, 我贴一下地址: [新仓库地址](https://github.com/boomker/rime-fast-xhup) [flypy_dict_generator_new.py](https://github.com/boomker/rime-fast-xhup/blob/22749b80972eaee01cabaf5d11f50b4d544e8223/scripts/flypy_dict_generator_new.py) [xhxm_map.py](https://github.com/boomker/rime-fast-xhup/blob/22749b80972eaee01cabaf5d11f50b4d544e8223/scripts/xhxm_map.py) 你那边先尝试用一下我的新脚本跑一下, 如果还有问题的话, 麻烦你在我的[项目](https://github.com/boomker/rime-fast-xhup)提 issue . 这样方便点, 这里的反馈我也会持续关注的. 然后的话, 脚本执行需要确保: 你的 python 版本是3 以上, 最好是3.11吧, 还需要安装依赖包 pypinyin 最后 window 系统, 你可能需要修改这个[脚本](https://github.com/boomker/rime-fast-xhup/blob/22749b80972eaee01cabaf5d11f50b4d544e8223/scripts/flypy_dict_generator_new.py)的第一行...
> 这位大哥 想请教一下你做的简体词库能调用吗?我把雾凇词库的文字词组文本直接复制进lypy_zrmfast.dict.yaml里面发现无法调用,你方便分享一下你扩充的词库吗? --- 我用的时小鹤双拼,如果你用的是自然码,是没法直接套用的哈 不建议直接拷到`flypy_zrmfast.dict.yaml`文件里,一是编码不一样,没法用;二是后续更新维护不方便 使用雾凇词库来作为扩展词库的话,有两种方式: 1. 写拼音运算规则,达到纯全拼到双拼的转换,这个雾凇的仓库已经带有各种双拼的方案了,这种最容易,成本低 2. 将雾凇的词库的所有词条转为双拼的,我[项目仓库](https://github.com/boomker/rime-fast-xhup.git)里词库都是这种,但只适配小鹤双拼。 另外,我仓库里简体词库转双拼词库,也只适配了小鹤双拼了,如果要适配其他双拼,得改代码(全拼到双拼的映射)