MaxMax2016
MaxMax2016
这个,我也是初学者,不会在windows下弄训练 @coderyiyang 很抱歉啊
开嗯好呃 ['kai1' 'n2' 'hao3' 'e4']
用这分支试试:https://github.com/PlayVoice/vits_chinese/tree/bert_vits
main合并了其他开发者提交的针对非标贝数据集的处理程序
两个都参考一下吧,数据格式多种多样的,我也无法确定哪个适合你
也许吧,我用的2000个人的语料库训练多说话人,LOSS在18左右,效果要比baker的(Loss为17)差点
@AwakingsWings 数据集多大啊?大佐味儿,训练集是日语的吧?语速特别快,首先语速是数据决定的,然后sdp时长预测很容易过拟合。
克隆推荐这个,https://github.com/Plachtaa/VITS-fast-fine-tuning ,有足够的算力、训练足够数据的预训练模型,克隆就很容易实现
https://github.com/PlayVoice/vits_chinese/issues/50
您要不试试 windows 的linux内核 WSL2,gbk应该是windows里面的中文兼容问题。新增发音人的方法,后面会尝试去做。使用单发音模型去训练新发音人不是一个好办法。