杨宇克 comments

Results 20 comments of


                                            杨宇克

V4具体怎么在api.py或api_v2.py里使用呢？

@dignome 感谢回复。我看到了tts_infer.yaml已经更新了v4模型，直接调用api_v2.py的结果合成出来的声音是很奇怪的，像是模型没匹配好。我的tts_infer.yaml如下： custom: bert_base_path: GPT_SoVITS/pretrained_models/chinese-roberta-wwm-ext-large cnhuhbert_base_path: GPT_SoVITS/pretrained_models/chinese-hubert-base device: cuda is_half: true t2s_weights_path: GPT_SoVITS/pretrained_models/s1v3.ckpt version: v4 vits_weights_path: GPT_SoVITS/pretrained_models/gsv-v4-pretrained/s2Gv4.pth v1: bert_base_path: GPT_SoVITS/pretrained_models/chinese-roberta-wwm-ext-large cnhuhbert_base_path: GPT_SoVITS/pretrained_models/chinese-hubert-base device: cpu is_half: false t2s_weights_path: GPT_SoVITS/pretrained_models/s1bert25hz-2kh-longer-epoch=68e-step=50232.ckpt version: v1...

V4具体怎么在api.py或api_v2.py里使用呢？

@wangzai23333 @inktree 是的。我自己也尝试去改tts_infer.yaml、api_v2.py里面相关内容，都没有良好的输出，所以想请花儿大佬完善一版api_v2.py 。：）

V4具体怎么在api.py或api_v2.py里使用呢？

> So is your issue resolved? api_v2.py worked for you? not yet

V4具体怎么在api.py或api_v2.py里使用呢？

> > 好像还是修改了tts_infer.yaml，运行api_v2.py会version自动变回v2，生成出来的音频应该是采样率不太对，会炸 > > GPT_SoVITS/TTS_infer_pack/TTS.py 第290行的问题: version = configs.get("version", "v2").lower() > > 现在的tts_infer.yaml中version不在根层级，所以get不到，用了默认值v2。最简单的办法是把这里改成v4然后提个bug。 api_v2.py好像改不了sampling_rate，音频出来还是怪得很

V4具体怎么在api.py或api_v2.py里使用呢？

> > > > 好像还是修改了tts_infer.yaml，运行api_v2.py会version自动变回v2，生成出来的音频应该是采样率不太对，会炸 > > > > > > > > > GPT_SoVITS/TTS_infer_pack/TTS.py 第290行的问题: version = configs.get("version", "v2").lower() > > > 现在的tts_infer.yaml中version不在根层级，所以get不到，用了默认值v2。最简单的办法是把这里改成v4然后提个bug。 > > > > > >...

v1-v4是不是都有さ行电音的问题

我试了V4还是有电音。。。不知道哪里出问题了

v4 推理速度问题

大佬，v4是怎么跑起来的?用的哪个脚本

用V4训练推理出来的音频全是电音的味道

> 各位大佬，首先非常感谢你们的这个项目，之前用V2训练推理的效果非常好，纵然长句还有瑕疵，但效果真的让人满意，训练速度也快，但是用新版V4，用将近2个小时的音频素材训练2轮和训练20轮推理出来的音频，全是满满的电音味儿，不管是100步还是几万步甚至是几十万步，推理出来的效果一模一样，也就是说训练步数跟推理效果没有任何关系。同样的音频素材一样的机器，V2就是好多了。 > > 请问各位大佬这是什么原因呢？你说的长句还有瑕疵，指的是长句有概率出现吞字多字吗？

经常出现漏字，而且不是只漏一两个字，是成句的漏，生成的语音中会出现参考音频的内容，

确定是V4版本的模型跑起来了的吗？

使用最新的V4版本，生成语音全是电音

我也是，v4版本跑出来的全是电音，api.py和api_v2.py都一样是的