GeneSin

Results 13 comments of GeneSin

> > 辛苦大佬测试解答,麻烦问一下大佬测试所用的模型是我提供的吗还是大佬本身的。我的原始样本应该是没有你这边处理的这么好,本身的电噪比较大 > > 底模用你的参考音频直接推理,理论上来看模型好坏不会导致数据打包出来有差异吧 我测试的差异是api和web在所有模型和参数一样的情况下,同样的文案出来的音频返回的正确率是web更稳定一些, 训练了几个模型, 都存在相同的问题,某些易错的的文字 , 同样的文字20次web 能有15次推理正确,api 5次正常, 而且是普遍性的

直接在GPT_SoVITS/inference_webui.py的基础上修改为api.api 效果好很多 ,不知道两边具体哪里出入这么明显

启动参数 ./runtime/bin/python api.py -s "SoVITS_weights_v2/xh2_e24_s600.pth" -g "GPT_weights_v2/xh2-e50.ckpt" -dr "output_xh/denoise_opt/vocal_vocal_xh.wav_main_vocal.wav_10.wav_0001643840_0001768000.wav" -dt "Everyone loves the library" -dl "en" -mt wav

> 控制dpo参数 是这个训练的时候勾选这个吗

> 推理的时候右侧参数调节 还是存在短padding在api.py中不发音问题,参数api和web调整的一样的,但是web可以发音 api不可以, demo http://[127.0.0.1:9880/?text=reference&text_language=en](http://127.0.0.1:9880/?text=reference&text_language=en)

有传递参数data = { "text": text, "text_language": "en", "top_k": 15, "top_p": 1, "temperature": 1, "speed": 1, }。两侧是一样的时候也一样的, api不出结果的次数概率多,web很少

有什么方式控制在一个随机值上吗?就是控制一个单词,每次发音都是一样的 这个参数是否是控制这个随机的

dns.google 给这个域名一个梯子