RVC-Boss
RVC-Boss
就是看你直接控制台打python能不能进,如果能进就是系统装过python,可能会和绿色包的py环境互相干扰
你很有想法! 有一个问题是,预训练的效果会降低,因为少了一层线性层,维度不对加载不进去。 我想针对你的case做对比实验,你是否介意分享数据集给我复现“高低音发音方式不同”这点?
另外还有一点是,音高其实是已经做过embedding输入进linear后的emb层的,所以你的猜想需要验证。
@matthew99a 我好像理解了,你的意思是不是,假如拿768去匹配,768语义非常接近但是音高差很多,可能就会匹配到音高距离目标音高差很多的训练集口型,然后后面模型强行把音高抬过去 我不太确定音高的度量和768维的度量是不是同样的尺度,就是说他们距离是不是就是简单的加上一维求距离就行,还是说要把音高乘上一个系数再769一起求距离,还是怎么做。你也提到了,假如音高的权重过大的话,咬字的牺牲又太大了。
In the next version I will achieve multi-processing for harvest
Better pitch method RMVPE is supported. Now harvest is not needed.
ok, in the next version I will modify it to save the latestest 2 ckpt.
No validation samples in RVC, because the training speed is fast. It's recommended to test for each ckpt of differenet epoch after training.
no space ("Ai tests")