GPT-SoVITS
GPT-SoVITS copied to clipboard
微调效果不如底模效果
微调数据500条,大约20分钟,微调vits20个epoch,没什么效果,大概需要多少数量,效果会好于底模?
感觉生成的语音效果受参考语音影响非常大。我2000条语音和10条语音微调出来差距也不大(不过都比底模像一点点)。
@v-yunbin 想问下微调的文档在哪儿呀 没看到微调的方法
@v-yunbin 想问下微调的文档在哪儿呀 没看到微调的方法
https://www.bilibili.com/video/BV12g4y1m7Uw/
@v-yunbin 想问下微调的文档在哪儿呀 没看到微调的方法
https://www.bilibili.com/video/BV12g4y1m7Uw/ 不微调基本就够用了,微调了效果不如底模呢。
@BlacknoSheep 看了下这个finetune流程是不是没法在远程服务器上跑呀? 没有命令行去finetune的吗
@sunnnnnnnny 可以通过
# 远程主机IP:端口号
xxx.xxx.xxx.xxx:9874
进行访问。 四个界面的端口号分别为:9874、9873、9872、9871。可以在config.py中进行查看和修改。
我用了一分钟左右的声音微调的效果也不如直接用底模推理的声音好。不知道是什么原因。