GPT-SoVITS 关于日文打标

在预训练日文词转音素时，模型容易误读某些汉字词的音素（例：主殿（あるじどの，a r u j i d o n o）会被误读成しゅでん，sh u d e N），而错误音素目前对用户是透明的，只能去2-name2text.txt查看，可能会对精标造成影响。虽然可以把汉字词全换成假名，但是可读性不高，所以可能需要一个能查看和修改转换后音素的打标器。

Aug 09 '24 09:08 ajlsunset

这部分精度受限于pyopenjtalk的词典，个人认为最好的解决方案是自己制作额外的词典并让pyopenjtalk指定用户词典。样例如下：然后使用

pyopenjtalk.mecab_dict_index("./userdic.csv",'user.dic')

编译该词典得到.dic的词典文件，并在运行时通过

pyopenjtalk.update_global_jtalk_with_user_dict ('user.dic') # 绝对路径

添加该词条。 (pyopenjtalk的默认词典根本不能指望....词条太少了)

Aug 09 '24 13:08 zliu-aki

这部分精度受限于pyopenjtalk的词典，个人认为最好的解决方案是自己制作额外的词典并让pyopenjtalk指定用户词典。样例如下：然后使用
pyopenjtalk.mecab_dict_index("./userdic.csv",'user.dic')
编译该词典得到.dic的词典文件，并在运行时通过
pyopenjtalk.update_global_jtalk_with_user_dict ('user.dic') # 绝对路径
添加该词条。 (pyopenjtalk的默认词典根本不能指望....词条太少了)

那如果遇到多音字有什么好的解决方法吗。

Aug 10 '24 04:08 ajlsunset

后面我们调研一下有没有什么好用的大字典

Aug 12 '24 02:08 RVC-Boss

这部分精度受限于pyopenjtalk的词典，个人认为最好的解决方案是自己制作额外的词典并让pyopenjtalk指定用户词典。样例如下：然后使用
pyopenjtalk.mecab_dict_index("./userdic.csv",'user.dic')
编译该词典得到.dic的词典文件，并在运行时通过
pyopenjtalk.update_global_jtalk_with_user_dict ('user.dic') # 绝对路径
添加该词条。 (pyopenjtalk的默认词典根本不能指望....词条太少了)

@Akito-UzukiP 大佬，方便告知下这么大的词表（190万+行）是怎么整理来的么？感谢~

Jun 20 '25 03:06 wyvernbai

这个辞典当时是用deepseek-v2对CMUDICT做的翻译（花了大概十几块钱的API），然后用tdmelodic标的高低调。这方面日本TTS社区那边应该有一些新的东西。

Jun 23 '25 18:06 zliu-aki

GPT-SoVITS GPT-SoVITS copied to clipboard

关于日文打标

GPT-SoVITS
GPT-SoVITS copied to clipboard