584761274
584761274
链接:https://pan.baidu.com/s/1eBX12_eJR8TvED15DdfD0g?pwd=1111 提取码:1111 我不知道gui如何上传音频文件 所以使用百度网盘上传 这是我训练的效果,我相信相同的步骤可以应用于其他语言 第一步 修改MockingBird-main\synthesizer\utils\symbols.py 中的参数  这里我是想训练日语tts 所以加入了所有的片假名 第二步 修改一个日语数据集,使其符合aidatatang_200zh, magicdata, aishell3, data_aishell的格式  第三步用数据集训练合成器(我认为只训练合成器就可以达到较好的效果,如果训练声码器和编码器效果应该会更好?)  (时间原因 我只训练了20k步 更长时间的训练应该能获得更好的效果)
> > 链接:https://pan.baidu.com/s/1eBX12_eJR8TvED15DdfD0g?pwd=1111码提取:1111 我不知道如何上传音频文件,使用百度网盘上传的步骤相同句号修改其他语言 tt 0 开头的日语会话的所有输入参数我是想加入的,所以这里的参数我是想加入 aidata0zh, magicdata、aishell3、data_aishell 的第三步用数据集合成器(我认为只训练合成器就可以达到更好的训练效果,如果编码器和编码器效果会更好?)只训练了20k步更长时间的应该可以获得更好的效果) > > 我们用的是,都是英伟的普通话。你直接用片假名训练的,我把同一个片假名再进一步转换为罗马达音进行。现在是90k步,效果只能说一般,部分文字还是识别不出来。 我对日语并不熟悉,但或许片假/平假对tts来说更易拟合? 我对目前训练的效果还是满意的 毕竟日语的大型数据集太难找了 我接下来会用jsut 和 jvs混合训练试一试
我训练到90k的时候会分享的,感觉loss还有下降的空间
 神经网络似乎可以自己对单词的时间进行划分 所以我没有划分单词时间 链接:https://pan.baidu.com/s/1_qn8nL7AKbAcBrmH8TcptQ?pwd=1111 提取码:1111