ferret

Results 10 comments of ferret

> 非常感谢提供模型,刚刚尝试了一下,体验如下: > > 1.整体效果较Readme中的第一个模型(三个数据集混合),还是有一些差距; 2.电音有点大,我在测“北京天气很不错”的时候,“错”字会出现回声; 3.在切换了录音人的时候,发现生成的是一样的音色,这一点有点不太理解(替换其他模型的时候,不会出现这样的问题) 4.对于batch size 深以为然,我用的是batch 12,三个数据集混合,到133k step,依然是电音,效果很差,准备重新训练。 > > 再次感谢,希望大家一起交流,训练出好的模型 个人之前用220K的aishell3单数据集克隆真实的女生语音,测试时就很不错。这个只跑了70K应该是比较差的,虽然loss值好看。但我并没有实际测试过这个70K的,因为无法生成有效的游戏角色语音克隆,故就放弃。

> 试用了几个现有的分享,能正常发音就很不错了,大多数情况下,要么是电音,要么就是部分是杂音,更不用说和原始声音相似了,距离克隆声音还有一段路,无奈自己的机器不行,没法自己训练 这个主要分享经验,如果你要相对好的结果,可以看我之前分享的160K aishell3,往后翻翻能找到

> 想咨询一下楼主 BATCH SIZAE怎么调高 我感觉我的3080TI还能再冲一冲 訓練合成器時:將 synthesizer/hparams.py中的batch_size參數調小 //調整前 tts_schedule = [(2, 1e-3, 20_000, 12), # Progressive training schedule (2, 5e-4, 40_000, 12), # (r, lr, step, batch_size) (2, 2e-4, 80_000,...

> 更新到最新版(2021/10/23)之后.利德 · 利德 > > ``` > Arguments: > datasets_root: D:\works\data > enc_models_dir: encoder\saved_models > syn_models_dir: synthesizer\saved_models > voc_models_dir: vocoder\saved_models > cpu: False > seed: None > no_mp3_support: False...

> https://pan.baidu.com/s/1pu_XfQJnLRcQZYfawqCeNQ ,提取码:7777 > > aishell3数据集,Tesla V100 32G,BS 96训练的160K,loss值0.24 > > 同时本人有两台V100 32G闲置,为BUG时撸的云服务器,有想训练啥的也可以提要求,反正闲着也是闲着。 新版本兼容性有问题,等待作者修复,现在要用这个模型请用我分享的旧版本。 链接:https://pan.baidu.com/s/14UweWwENPc0myDLezy8L3Q 提取码:7777

> > > [https://pan.baidu.com/s/1pu_XfQJnLRcQZYfawqCeNQ,提取码:7777](https://pan.baidu.com/s/1pu_XfQJnLRcQZYfawqCeNQ%EF%BC%8C%E6%8F%90%E5%8F%96%E7%A0%81%EF%BC%9A7777) > > > aishell3数据集,特斯拉V100 32G,BS 96训练的160K,损失值0.24 > > > 同时本人有两台V100 32G闲置,为BUG时撸的云服务器,有想练啥的也可以提要求,休息一下也是闲着。 > > > > > > 新版本有问题,作者修复,现在要用模型这个请用我分享的旧版本。 链接:[https](https://pan.baidu.com/s/14UweWwENPc0myDLezy8L3Q) : //pan.baidu.com/s/14UweWwENPc0myDLezy8L3Q提取码:7777 > > 抱歉,打扰了,现在才看到这个,已经解决问题了。十分感谢分享,这对我意义重大!再次感谢 看到你成功运行我也很开心,自己运行第一个项目能够成功确实是值得庆幸的事情!

> > > https://pan.baidu.com/s/1pu_XfQJnLRcQZYfawqCeNQ ,提取码:7777 > > > aishell3数据集,Tesla V100 32G,BS 96训练的160K,loss值0.24 > > > 同时本人有两台V100 32G闲置,为BUG时撸的云服务器,有想训练啥的也可以提要求,反正闲着也是闲着。 > > > > > > 新版本兼容性有问题,等待作者修复,现在要用这个模型请用我分享的旧版本。 链接:https://pan.baidu.com/s/14UweWwENPc0myDLezy8L3Q 提取码:7777 > > 这个链接失效了,可以劳烦再发一次嘛 无需使用这个了,在本项目主页的tag当中,有作者发布的旧版本压缩包

> 这个模型我载入测试时,效果还是不好,目前我测试下来效果最好的还是作者发布的那个ceshi.pt,请问是有哪些地方配置不对吗?(另外,其实也很想知道作者训练ceshi.pt时的参数配置,如何训练重现,因为我训练的几个模型效果也是很差很差) 这个模型实际上我未曾测试过,只是看着loss好看发出来。我建议你可以测试我另外一个aishell3 160K的,那个我有实测过效果不错。

> > > > > > 这个模型我载入测试时,效果还是不好,目前我测试下来效果最好的还是作者发布的那个ceshi.pt,请问是有哪些地方配置不对吗?(另外,其实也很想知道作者训练ceshi.pt时的参数配置,如何训练重现,因为我训练的几个模型效果也是很差很差) > > > > > > 这个模型实际上我未曾测试过,只是看着loss好看发出来。我建议你可以测试我另外一个aishell3 160K的,那个我有实测过效果不错。 > > 我就是下载的您云盘分享的“aishell3 160K BS96模型”,这个是您说的实测过的吧? 这个在真人语音,只用9句话的情况下,跑40K即可有非常不错的效果。另外在游戏角色的语音克隆下也有一点勉强可用的效果。不知道你的自定义数据集多大,也许你用少量的自定义数据集跑一下会有不错的效果

> > > > > > > > > > > > > > > 这个模型我载入测试时,效果还是不好,目前我测试下来效果最好的还是作者发布的那个ceshi.pt,请问是有哪些地方配置不对吗?(另外,其实也很想知道作者训练ceshi.pt时的参数配置,如何训练重现,因为我训练的几个模型效果也是很差很差) > > > > > > > > > > > > 这个模型实际上我未曾测试过,只是看着loss好看发出来。我建议你可以测试我另外一个aishell3 160K的,那个我有实测过效果不错。...