GeneSin comments

Results 13 comments of


                                            GeneSin

在同参数下，多次测试，api比webui中的推理产生的音频噪音要大

是的，我测试过一样的结果，同样疑惑

在同参数下，多次测试，api比webui中的推理产生的音频噪音要大

> > 辛苦大佬测试解答，麻烦问一下大佬测试所用的模型是我提供的吗还是大佬本身的。我的原始样本应该是没有你这边处理的这么好，本身的电噪比较大 > > 底模用你的参考音频直接推理，理论上来看模型好坏不会导致数据打包出来有差异吧我测试的差异是api和web在所有模型和参数一样的情况下，同样的文案出来的音频返回的正确率是web更稳定一些，训练了几个模型，都存在相同的问题，某些易错的的文字，同样的文字20次web 能有15次推理正确，api 5次正常，而且是普遍性的

在同参数下，多次测试，api比webui中的推理产生的音频噪音要大

直接在GPT_SoVITS/inference_webui.py的基础上修改为api.api 效果好很多，不知道两边具体哪里出入这么明显

在同参数下，多次测试，api比webui中的推理产生的音频噪音要大

新更新的是定位到修复了这个问题吗？

单词丢失

启动参数 ./runtime/bin/python api.py -s "SoVITS_weights_v2/xh2_e24_s600.pth" -g "GPT_weights_v2/xh2-e50.ckpt" -dr "output_xh/denoise_opt/vocal_vocal_xh.wav_main_vocal.wav_10.wav_0001643840_0001768000.wav" -dt "Everyone loves the library" -dl "en" -mt wav

单词丢失

> 控制dpo参数是这个训练的时候勾选这个吗

单词丢失

> 推理的时候右侧参数调节还是存在短padding在api.py中不发音问题，参数api和web调整的一样的，但是web可以发音 api不可以， demo http://[127.0.0.1:9880/?text=reference&text_language=en](http://127.0.0.1:9880/?text=reference&text_language=en)

单词丢失

有传递参数data = { "text": text, "text_language": "en", "top_k": 15, "top_p": 1, "temperature": 1, "speed": 1, }。两侧是一样的时候也一样的， api不出结果的次数概率多，web很少

单词丢失

有什么方式控制在一个随机值上吗？就是控制一个单词，每次发音都是一样的这个参数是否是控制这个随机的

打开webui的时候卡Loading...

dns.google 给这个域名一个梯子