MaxMax2016
MaxMax2016
可以试试其他的,例如:https://github.com/Ailln/cn2an 直接把这三行代码删除,他们在这个文件:https://github.com/PlayVoice/vits_chinese/blob/bert_vits_aishell3/vits_pinyin.py ``` from tn.chinese.normalizer import Normalizer self.normalizer = Normalizer() text = self.normalizer.normalize(text) ```
1,标贝数据集比较少,如果用于生产、您应该有更多的数据训练模型 2,net_g.infer(x_tst, x_tst_lengths, x_tst_prosody, noise_scale=0.5, length_scale=1) 减小noise_scale,甚至设置为0
noise控制先验分布的采样方差,方差越大,变化越大,韵律越强,越容易发生错误。
先用你的数据训练sovits,然后把标贝数据转换成你的数据,然后再用本项目按标贝训练。
标贝模型是单人模型,不支持加入别的角色进行二次训练。
要实现多角色,需要改代码;单30系列GPU,VITS要训练1周左右;这里的teacher和student是用来做模型压缩的,不是用来改变音色的。
现在不支持,但是可以做,要不要做做?
红色圈圈里面  https://github.com/PlayVoice/vits_chinese/blob/master/train.py#L267
@kendo6666 分块流式 https://github.com/PlayVoice/vits_chinese/blob/master/models.py#L931~L970 hop_frame有个最小值,这个值是试出来的