杨宇克

Results 20 comments of 杨宇克

@dignome 感谢回复。我看到了tts_infer.yaml已经更新了v4模型,直接调用api_v2.py的结果合成出来的声音是很奇怪的,像是模型没匹配好。我的tts_infer.yaml如下: custom: bert_base_path: GPT_SoVITS/pretrained_models/chinese-roberta-wwm-ext-large cnhuhbert_base_path: GPT_SoVITS/pretrained_models/chinese-hubert-base device: cuda is_half: true t2s_weights_path: GPT_SoVITS/pretrained_models/s1v3.ckpt version: v4 vits_weights_path: GPT_SoVITS/pretrained_models/gsv-v4-pretrained/s2Gv4.pth v1: bert_base_path: GPT_SoVITS/pretrained_models/chinese-roberta-wwm-ext-large cnhuhbert_base_path: GPT_SoVITS/pretrained_models/chinese-hubert-base device: cpu is_half: false t2s_weights_path: GPT_SoVITS/pretrained_models/s1bert25hz-2kh-longer-epoch=68e-step=50232.ckpt version: v1...

@wangzai23333 @inktree 是的。我自己也尝试去改tts_infer.yaml、api_v2.py里面相关内容,都没有良好的输出,所以想请花儿大佬完善一版api_v2.py 。:)

> So is your issue resolved? api_v2.py worked for you? not yet

> > 好像还是修改了tts_infer.yaml,运行api_v2.py会version自动变回v2,生成出来的音频应该是采样率不太对,会炸 > > GPT_SoVITS/TTS_infer_pack/TTS.py 第290行的问题: version = configs.get("version", "v2").lower() > > 现在的tts_infer.yaml中version不在根层级,所以get不到,用了默认值v2。最简单的办法是把这里改成v4然后提个bug。 api_v2.py好像改不了sampling_rate,音频出来还是怪得很

> > > > 好像还是修改了tts_infer.yaml,运行api_v2.py会version自动变回v2,生成出来的音频应该是采样率不太对,会炸 > > > > > > > > > GPT_SoVITS/TTS_infer_pack/TTS.py 第290行的问题: version = configs.get("version", "v2").lower() > > > 现在的tts_infer.yaml中version不在根层级,所以get不到,用了默认值v2。最简单的办法是把这里改成v4然后提个bug。 > > > > > >...

我试了V4还是有电音。。。不知道哪里出问题了

大佬,v4是怎么跑起来的?用的哪个脚本

> 各位大佬,首先非常感谢你们的这个项目,之前用V2训练推理的效果非常好,纵然长句还有瑕疵,但效果真的让人满意,训练速度也快,但是用新版V4,用将近2个小时的音频素材训练2轮和训练20轮推理出来的音频,全是满满的电音味儿,不管是100步还是几万步甚至是几十万步,推理出来的效果一模一样,也就是说训练步数跟推理效果没有任何关系。同样的音频素材一样的机器,V2就是好多了。 > > 请问各位大佬这是什么原因呢? 你说的长句还有瑕疵,指的是长句有概率出现吞字多字吗?

我也是,v4版本跑出来的全是电音,api.py和api_v2.py都一样是的