Results 13 comments of TingC-95

Same question. Can anyone who success in executing export_onnx_cpu.py share pytorch, onnx and onnxruntime version? 遇到相同的问题。是否有成功export的朋友分享一下pythorch,onnx和 onnxruntime的版本呢?

I reproduce this issue under torch 1.10.0 + onnx 1.12.0 + onnxruntim 1.12.1 But when I upgrade torch to 1.12.0, this issue disapeared.

同好奇~数据的来源是什么呀?需要高音质、精确标注么?

如果每次合成的时候用前一句合成的结果作为prompt会不会好一些?

为什么会需要很长的参考音频?我感觉短的也挺像的呀

你的描述有点模糊,效果不好的因素可能很多,你是为什么会怀疑是长度的问题呢? 我们假设是长度的问题,那么应该使用仓库里面提供的自动切割工具,先把长音频切短之后再训练推理呀 我们假设是音质的问题,那就用用工具先处理一下音质 https://github.com/RVC-Boss/GPT-SoVITS/issues/568#issuecomment-1956319044

https://modelscope.cn/models/iic/speech_frcrn_ans_cirm_16k/summary

选了的,CPU 上操作过程跟GPU上一样的。 使用的是colab的环境

“换句话说 你用类似的方案但预测whisper的ppg也是可以的” - RVQ的结构是因为 hubert 的音色泄露比较严重吗?用PPG就不需要RVQ的结构了,是这么理解吗?