ferret comments

Results 10 comments of


                                            ferret

第二次贡献模型，同时谈谈相关经验。

> 非常感谢提供模型，刚刚尝试了一下，体验如下： > > 1.整体效果较Readme中的第一个模型（三个数据集混合），还是有一些差距； 2.电音有点大，我在测“北京天气很不错”的时候，“错”字会出现回声； 3.在切换了录音人的时候，发现生成的是一样的音色，这一点有点不太理解（替换其他模型的时候，不会出现这样的问题） 4.对于batch size 深以为然，我用的是batch 12，三个数据集混合，到133k step，依然是电音，效果很差，准备重新训练。 > > 再次感谢，希望大家一起交流，训练出好的模型个人之前用220K的aishell3单数据集克隆真实的女生语音，测试时就很不错。这个只跑了70K应该是比较差的，虽然loss值好看。但我并没有实际测试过这个70K的，因为无法生成有效的游戏角色语音克隆，故就放弃。

第二次贡献模型，同时谈谈相关经验。

> 试用了几个现有的分享，能正常发音就很不错了，大多数情况下，要么是电音，要么就是部分是杂音，更不用说和原始声音相似了，距离克隆声音还有一段路，无奈自己的机器不行，没法自己训练这个主要分享经验，如果你要相对好的结果，可以看我之前分享的160K aishell3，往后翻翻能找到

第二次贡献模型，同时谈谈相关经验。

> 想咨询一下楼主 BATCH SIZAE怎么调高我感觉我的3080TI还能再冲一冲訓練合成器時：將 synthesizer/hparams.py中的batch_size參數調小 //調整前 tts_schedule = [(2, 1e-3, 20_000, 12), # Progressive training schedule (2, 5e-4, 40_000, 12), # (r, lr, step, batch_size) (2, 2e-4, 80_000,...

来贡献模型了，aishell3的

> 更新到最新版(2021/10/23)之后.利德 · 利德 > > ``` > Arguments: > datasets_root: D:\works\data > enc_models_dir: encoder\saved_models > syn_models_dir: synthesizer\saved_models > voc_models_dir: vocoder\saved_models > cpu: False > seed: None > no_mp3_support: False...

来贡献模型了，aishell3的

> https://pan.baidu.com/s/1pu_XfQJnLRcQZYfawqCeNQ ，提取码：7777 > > aishell3数据集，Tesla V100 32G，BS 96训练的160K，loss值0.24 > > 同时本人有两台V100 32G闲置，为BUG时撸的云服务器，有想训练啥的也可以提要求，反正闲着也是闲着。新版本兼容性有问题，等待作者修复，现在要用这个模型请用我分享的旧版本。链接：https://pan.baidu.com/s/14UweWwENPc0myDLezy8L3Q 提取码：7777

来贡献模型了，aishell3的

> > > [https://pan.baidu.com/s/1pu_XfQJnLRcQZYfawqCeNQ，提取码：7777](https://pan.baidu.com/s/1pu_XfQJnLRcQZYfawqCeNQ%EF%BC%8C%E6%8F%90%E5%8F%96%E7%A0%81%EF%BC%9A7777) > > > aishell3数据集，特斯拉V100 32G，BS 96训练的160K，损失值0.24 > > > 同时本人有两台V100 32G闲置，为BUG时撸的云服务器，有想练啥的也可以提要求，休息一下也是闲着。 > > > > > > 新版本有问题，作者修复，现在要用模型这个请用我分享的旧版本。链接：[https](https://pan.baidu.com/s/14UweWwENPc0myDLezy8L3Q) : //pan.baidu.com/s/14UweWwENPc0myDLezy8L3Q提取码：7777 > > 抱歉，打扰了，现在才看到这个，已经解决问题了。十分感谢分享，这对我意义重大！再次感谢看到你成功运行我也很开心，自己运行第一个项目能够成功确实是值得庆幸的事情！

来贡献模型了，aishell3的

> > > https://pan.baidu.com/s/1pu_XfQJnLRcQZYfawqCeNQ ，提取码：7777 > > > aishell3数据集，Tesla V100 32G，BS 96训练的160K，loss值0.24 > > > 同时本人有两台V100 32G闲置，为BUG时撸的云服务器，有想训练啥的也可以提要求，反正闲着也是闲着。 > > > > > > 新版本兼容性有问题，等待作者修复，现在要用这个模型请用我分享的旧版本。链接：https://pan.baidu.com/s/14UweWwENPc0myDLezy8L3Q 提取码：7777 > > 这个链接失效了，可以劳烦再发一次嘛无需使用这个了，在本项目主页的tag当中，有作者发布的旧版本压缩包

来贡献模型了，aishell3的

> 这个模型我载入测试时，效果还是不好，目前我测试下来效果最好的还是作者发布的那个ceshi.pt，请问是有哪些地方配置不对吗？（另外，其实也很想知道作者训练ceshi.pt时的参数配置，如何训练重现，因为我训练的几个模型效果也是很差很差）这个模型实际上我未曾测试过，只是看着loss好看发出来。我建议你可以测试我另外一个aishell3 160K的，那个我有实测过效果不错。

来贡献模型了，aishell3的

> > > > > > 这个模型我载入测试时，效果还是不好，目前我测试下来效果最好的还是作者发布的那个ceshi.pt，请问是有哪些地方配置不对吗？（另外，其实也很想知道作者训练ceshi.pt时的参数配置，如何训练重现，因为我训练的几个模型效果也是很差很差） > > > > > > 这个模型实际上我未曾测试过，只是看着loss好看发出来。我建议你可以测试我另外一个aishell3 160K的，那个我有实测过效果不错。 > > 我就是下载的您云盘分享的“aishell3 160K BS96模型”，这个是您说的实测过的吧？这个在真人语音，只用9句话的情况下，跑40K即可有非常不错的效果。另外在游戏角色的语音克隆下也有一点勉强可用的效果。不知道你的自定义数据集多大，也许你用少量的自定义数据集跑一下会有不错的效果

来贡献模型了，aishell3的

> > > > > > > > > > > > > > > 这个模型我载入测试时，效果还是不好，目前我测试下来效果最好的还是作者发布的那个ceshi.pt，请问是有哪些地方配置不对吗？（另外，其实也很想知道作者训练ceshi.pt时的参数配置，如何训练重现，因为我训练的几个模型效果也是很差很差） > > > > > > > > > > > > 这个模型实际上我未曾测试过，只是看着loss好看发出来。我建议你可以测试我另外一个aishell3 160K的，那个我有实测过效果不错。...