GPT-SoVITS
GPT-SoVITS copied to clipboard
关于日文打标
在预训练日文词转音素时,模型容易误读某些汉字词的音素(例:主殿(あるじどの,a r u j i d o n o)会被误读成しゅでん,sh u d e N),而错误音素目前对用户是透明的,只能去2-name2text.txt查看,可能会对精标造成影响。 虽然可以把汉字词全换成假名,但是可读性不高,所以可能需要一个能查看和修改转换后音素的打标器。
这部分精度受限于pyopenjtalk的词典,个人认为最好的解决方案是自己制作额外的词典并让pyopenjtalk指定用户词典。样例如下:
然后使用
pyopenjtalk.mecab_dict_index("./userdic.csv",'user.dic')
编译该词典得到.dic的词典文件,并在运行时通过
pyopenjtalk.update_global_jtalk_with_user_dict ('user.dic') # 绝对路径
添加该词条。 (pyopenjtalk的默认词典根本不能指望....词条太少了)
这部分精度受限于pyopenjtalk的词典,个人认为最好的解决方案是自己制作额外的词典并让pyopenjtalk指定用户词典。样例如下:
然后使用
pyopenjtalk.mecab_dict_index("./userdic.csv",'user.dic')编译该词典得到.dic的词典文件,并在运行时通过
pyopenjtalk.update_global_jtalk_with_user_dict ('user.dic') # 绝对路径添加该词条。 (pyopenjtalk的默认词典根本不能指望....词条太少了)
那如果遇到多音字有什么好的解决方法吗。
后面我们调研一下有没有什么好用的大字典
这部分精度受限于pyopenjtalk的词典,个人认为最好的解决方案是自己制作额外的词典并让pyopenjtalk指定用户词典。样例如下:
然后使用
pyopenjtalk.mecab_dict_index("./userdic.csv",'user.dic')编译该词典得到.dic的词典文件,并在运行时通过
pyopenjtalk.update_global_jtalk_with_user_dict ('user.dic') # 绝对路径添加该词条。 (pyopenjtalk的默认词典根本不能指望....词条太少了)
@Akito-UzukiP 大佬,方便告知下这么大的词表(190万+行)是怎么整理来的么? 感谢~
这个辞典当时是用deepseek-v2对CMUDICT做的翻译(花了大概十几块钱的API),然后用tdmelodic标的高低调。这方面日本TTS社区那边应该有一些新的东西。
然后使用