GPT-SoVITS icon indicating copy to clipboard operation
GPT-SoVITS copied to clipboard

微调效果不如底模效果

Open ben-8878 opened this issue 1 year ago • 7 comments

微调数据500条,大约20分钟,微调vits20个epoch,没什么效果,大概需要多少数量,效果会好于底模?

ben-8878 avatar Jan 24 '24 11:01 ben-8878

感觉生成的语音效果受参考语音影响非常大。我2000条语音和10条语音微调出来差距也不大(不过都比底模像一点点)。

BlacknoSheep avatar Jan 24 '24 13:01 BlacknoSheep

@v-yunbin 想问下微调的文档在哪儿呀 没看到微调的方法

sunnnnnnnny avatar Jan 25 '24 11:01 sunnnnnnnny

@v-yunbin 想问下微调的文档在哪儿呀 没看到微调的方法

https://www.bilibili.com/video/BV12g4y1m7Uw/

BlacknoSheep avatar Jan 25 '24 12:01 BlacknoSheep

@v-yunbin 想问下微调的文档在哪儿呀 没看到微调的方法

https://www.bilibili.com/video/BV12g4y1m7Uw/ 不微调基本就够用了,微调了效果不如底模呢。

ben-8878 avatar Jan 26 '24 06:01 ben-8878

@BlacknoSheep 看了下这个finetune流程是不是没法在远程服务器上跑呀? 没有命令行去finetune的吗

sunnnnnnnny avatar Jan 26 '24 07:01 sunnnnnnnny

@sunnnnnnnny 可以通过

# 远程主机IP:端口号
xxx.xxx.xxx.xxx:9874

进行访问。 四个界面的端口号分别为:9874、9873、9872、9871。可以在config.py中进行查看和修改。

BlacknoSheep avatar Jan 26 '24 09:01 BlacknoSheep

我用了一分钟左右的声音微调的效果也不如直接用底模推理的声音好。不知道是什么原因。

qt06 avatar Jan 30 '24 02:01 qt06