584761274 comments

Results 4 comments of

584761274

【长期】跨语言支持

链接：https://pan.baidu.com/s/1eBX12_eJR8TvED15DdfD0g?pwd=1111 提取码：1111 我不知道gui如何上传音频文件所以使用百度网盘上传这是我训练的效果，我相信相同的步骤可以应用于其他语言第一步修改MockingBird-main\synthesizer\utils\symbols.py 中的参数 ![QQ图片20220515232233](https://user-images.githubusercontent.com/75121140/168480732-5c3a9efc-76b4-4016-9f9a-249a0560cf27.png) 这里我是想训练日语tts 所以加入了所有的片假名第二步修改一个日语数据集，使其符合aidatatang_200zh, magicdata, aishell3, data_aishell的格式 ![image](https://user-images.githubusercontent.com/75121140/168480810-8408479b-6b60-49b0-83e2-cfe7cb4b2ec1.png) 第三步用数据集训练合成器（我认为只训练合成器就可以达到较好的效果，如果训练声码器和编码器效果应该会更好？） ![step-20500-mel-spectrogram_sample_1](https://user-images.githubusercontent.com/75121140/168480885-f0a3aa7f-57b1-487e-acc4-2cf4a67d29bb.png) （时间原因我只训练了20k步更长时间的训练应该能获得更好的效果）

【长期】跨语言支持

> > 链接：https://pan.baidu.com/s/1eBX12_eJR8TvED15DdfD0g?pwd=1111码提取：1111 我不知道如何上传音频文件，使用百度网盘上传的步骤相同句号修改其他语言 tt 0 开头的日语会话的所有输入参数我是想加入的，所以这里的参数![QQ图片20220515232233](https://user-images.githubusercontent.com/75121140/168480732-5c3a9efc-76b4-4016-9f9a-249a0560cf27.png)我是想加入 aidata0zh， magicdata、aishell3、data_aishell 的第三![图片](https://user-images.githubusercontent.com/75121140/168480810-8408479b-6b60-49b0-83e2-cfe7cb4b2ec1.png)步用数据集合成器（我认为只训练合成器就可以达到更好的训练效果，如果编码器和编码器效果会更好？）![step-20500-mel-spectrogram_sample_1](https://user-images.githubusercontent.com/75121140/168480885-f0a3aa7f-57b1-487e-acc4-2cf4a67d29bb.png)只训练了20k步更长时间的应该可以获得更好的效果） > > 我们用的是，都是英伟的普通话。你直接用片假名训练的，我把同一个片假名再进一步转换为罗马达音进行。现在是90k步，效果只能说一般，部分文字还是识别不出来。我对日语并不熟悉，但或许片假/平假对tts来说更易拟合？我对目前训练的效果还是满意的毕竟日语的大型数据集太难找了我接下来会用jsut 和 jvs混合训练试一试

【长期】跨语言支持

我训练到90k的时候会分享的，感觉loss还有下降的空间

【长期】跨语言支持

![image](https://user-images.githubusercontent.com/75121140/168517998-858af7e6-ba99-46b3-b618-d6d5c9ac313f.png) 神经网络似乎可以自己对单词的时间进行划分所以我没有划分单词时间链接：https://pan.baidu.com/s/1_qn8nL7AKbAcBrmH8TcptQ?pwd=1111 提取码：1111