GPT-SoVITS 微调效果不如底模效果

微调数据500条，大约20分钟，微调vits20个epoch，没什么效果，大概需要多少数量，效果会好于底模？

Jan 24 '24 11:01 zyb8543d

感觉生成的语音效果受参考语音影响非常大。我2000条语音和10条语音微调出来差距也不大（不过都比底模像一点点）。

Jan 24 '24 13:01 BlacknoSheep

@v-yunbin 想问下微调的文档在哪儿呀没看到微调的方法

Jan 25 '24 11:01 sunnnnnnnny

@v-yunbin 想问下微调的文档在哪儿呀没看到微调的方法

https://www.bilibili.com/video/BV12g4y1m7Uw/

Jan 25 '24 12:01 BlacknoSheep

@v-yunbin 想问下微调的文档在哪儿呀没看到微调的方法

https://www.bilibili.com/video/BV12g4y1m7Uw/ 不微调基本就够用了，微调了效果不如底模呢。

Jan 26 '24 06:01 zyb8543d

@BlacknoSheep 看了下这个finetune流程是不是没法在远程服务器上跑呀？没有命令行去finetune的吗

Jan 26 '24 07:01 sunnnnnnnny

@sunnnnnnnny 可以通过

# 远程主机IP:端口号
xxx.xxx.xxx.xxx:9874

进行访问。四个界面的端口号分别为：9874、9873、9872、9871。可以在config.py中进行查看和修改。

Jan 26 '24 09:01 BlacknoSheep

我用了一分钟左右的声音微调的效果也不如直接用底模推理的声音好。不知道是什么原因。

Jan 30 '24 02:01 qt06