TingC-95 comments

Results 13 comments of


                                            TingC-95

Exec export_onnx_cpu.py error

Same question. Can anyone who success in executing export_onnx_cpu.py share pytorch, onnx and onnxruntime version? 遇到相同的问题。是否有成功export的朋友分享一下pythorch，onnx和 onnxruntime的版本呢？

Exec export_onnx_cpu.py error

I reproduce this issue under torch 1.10.0 + onnx 1.12.0 + onnxruntim 1.12.1 But when I upgrade torch to 1.12.0, this issue disapeared.

当前底模是多大的数据集训练的？

同好奇~数据的来源是什么呀？需要高音质、精确标注么？

Long-Form Inference (长式推理)

如果每次合成的时候用前一句合成的结果作为prompt会不会好一些？

参考音频时长可以是1分钟么？10秒太短了

为什么会需要很长的参考音频？我感觉短的也挺像的呀

参考音频时长可以是1分钟么？10秒太短了

你的描述有点模糊，效果不好的因素可能很多，你是为什么会怀疑是长度的问题呢？我们假设是长度的问题，那么应该使用仓库里面提供的自动切割工具，先把长音频切短之后再训练推理呀我们假设是音质的问题，那就用用工具先处理一下音质 https://github.com/RVC-Boss/GPT-SoVITS/issues/568#issuecomment-1956319044

参考音频时长可以是1分钟么？10秒太短了

https://modelscope.cn/models/iic/speech_frcrn_ans_cirm_16k/summary

参考音频时长可以是1分钟么？10秒太短了

https://github.com/xiph/rnnoise

在colab使用cpu推断报错

选了的，CPU 上操作过程跟GPU上一样的。使用的是colab的环境

视频里说的有点乱，一句话告诉你这模型是干啥的

“换句话说你用类似的方案但预测whisper的ppg也是可以的” - RVQ的结构是因为 hubert 的音色泄露比较严重吗？用PPG就不需要RVQ的结构了，是这么理解吗？