vits_chinese issues

训练异常

4

我使用了baker + 加上自己的语音数据，共250个说话者，存在数据不均衡的情况，部分说话者的语音数量偏少，发现训练到100个epoch时，损失基本都是在一定范围内震荡了，且合成的语音质量不如单个说话者训练出来的模型，请问该怎么优化呢？ ![image](https://github.com/PlayVoice/vits_chinese/assets/86715812/33aca5d2-24de-4c82-a648-799f3cdbcd84)

GDbbq

请问有人碰到过吞字吞音的情况吗？

4

比如一个汉字的声母被吞，或者韵母尾部听起来有丢失，这种情况是因为什么呢？对比了它和gt的duration，发现duration是一致的，但就是高低频里对声母的发音或者韵母的发音不好。请问有人碰到过这种情况吗？

MisakaMikoto96

模型大小不一致

2

请问vits-bert-model.pth等效于G_1000.pth吗推理正常，想请教为什么模型大小不同，下载的发布的vits-bert-model.pth 156M 自己训练出的G_1000.pth 564M

Waitday

如何准备自己的数据集

10

请假，如何准备自己想要的数据集

xiaoyin199

关于模型压缩

29

感谢大佬开源这么棒的项目，请问关于模型压缩这块，模型蒸馏具体是什么做的呢，能简单告知一下吗

uloveqian2021

help wanted

蒸馏后的学生模型在新数据集上微调的问题

蒸馏后的学生模型是直接在新数据集上微调，还是需要先在新数据集上微调教师模型，再用新数据集去蒸馏学生模型？

Yaodada12

关于知识蒸馏

2

作者你好，麻烦问一下知识蒸馏用的什么方法呀？有参考论文或者项目吗？

Isshang

TinaChen95

vits_chinese
vits_chinese copied to clipboard

Metadata

训练异常

请问有人碰到过吞字吞音的情况吗？

模型大小不一致

如何准备自己的数据集

关于模型压缩

蒸馏后的学生模型在新数据集上微调的问题

关于知识蒸馏

训练过程中的语谱图？

DEBUG:httpcore.connection:close.complete

关于学生模型

← Metadata

Owner

Metadata

vits_chinese vits_chinese copied to clipboard

Metadata

← Metadata

Owner

Metadata

vits_chinese
vits_chinese copied to clipboard