MaxMax2016
MaxMax2016
训练数据样例是指 wav ?是的
可以使用tensorboard --logdir logs/ 查看和听训练效果
80分钟左右人声,是一个人的还是多个人的?
这个页面可以听训练效果
上面5个是模型生成的,下面5个是原始音频;5这个数字是设置的。
上面展示的都是最新的模型的效果,就是序号最大的那个
https://github.com/PlayVoice/lora-svc/blob/main/config/maxgan.yaml#L58
网上那些是有强大的后期混音的,百万修音师那种;弄一个UI编辑F0是很有必要的,现在还没有白嫖的完全能用的F0提取模型和算法。
torch是什么版本呢?
我用3060 6G的笔记本跑的微调,应该不是显存不够; 应该是这个问题:https://github.com/pytorch/pytorch/issues/88038