GPT-SoVITS icon indicating copy to clipboard operation
GPT-SoVITS copied to clipboard

关于日文打标

Open ajlsunset opened this issue 1 year ago • 3 comments

在预训练日文词转音素时,模型容易误读某些汉字词的音素(例:主殿(あるじどの,a r u j i d o n o)会被误读成しゅでん,sh u d e N),而错误音素目前对用户是透明的,只能去2-name2text.txt查看,可能会对精标造成影响。 虽然可以把汉字词全换成假名,但是可读性不高,所以可能需要一个能查看和修改转换后音素的打标器。

ajlsunset avatar Aug 09 '24 09:08 ajlsunset

这部分精度受限于pyopenjtalk的词典,个人认为最好的解决方案是自己制作额外的词典并让pyopenjtalk指定用户词典。样例如下: image 然后使用

pyopenjtalk.mecab_dict_index("./userdic.csv",'user.dic')

编译该词典得到.dic的词典文件,并在运行时通过

pyopenjtalk.update_global_jtalk_with_user_dict ('user.dic') # 绝对路径

添加该词条。 (pyopenjtalk的默认词典根本不能指望....词条太少了)

zliu-aki avatar Aug 09 '24 13:08 zliu-aki

这部分精度受限于pyopenjtalk的词典,个人认为最好的解决方案是自己制作额外的词典并让pyopenjtalk指定用户词典。样例如下: image 然后使用

pyopenjtalk.mecab_dict_index("./userdic.csv",'user.dic')

编译该词典得到.dic的词典文件,并在运行时通过

pyopenjtalk.update_global_jtalk_with_user_dict ('user.dic') # 绝对路径

添加该词条。 (pyopenjtalk的默认词典根本不能指望....词条太少了)

那如果遇到多音字有什么好的解决方法吗。

ajlsunset avatar Aug 10 '24 04:08 ajlsunset

后面我们调研一下有没有什么好用的大字典

RVC-Boss avatar Aug 12 '24 02:08 RVC-Boss

这部分精度受限于pyopenjtalk的词典,个人认为最好的解决方案是自己制作额外的词典并让pyopenjtalk指定用户词典。样例如下: image 然后使用

pyopenjtalk.mecab_dict_index("./userdic.csv",'user.dic')

编译该词典得到.dic的词典文件,并在运行时通过

pyopenjtalk.update_global_jtalk_with_user_dict ('user.dic') # 绝对路径

添加该词条。 (pyopenjtalk的默认词典根本不能指望....词条太少了)

@Akito-UzukiP 大佬,方便告知下这么大的词表(190万+行)是怎么整理来的么? 感谢~

wyvernbai avatar Jun 20 '25 03:06 wyvernbai

这个辞典当时是用deepseek-v2对CMUDICT做的翻译(花了大概十几块钱的API),然后用tdmelodic标的高低调。这方面日本TTS社区那边应该有一些新的东西。

zliu-aki avatar Jun 23 '25 18:06 zliu-aki