GPT-SoVITS icon indicating copy to clipboard operation
GPT-SoVITS copied to clipboard

1 min voice data can also be used to train a good TTS model! (few shot voice cloning)

Results 1028 GPT-SoVITS issues
Sort by recently updated
recently updated
newest added

我注意到微调代码中语音采取的32k的代码进行load,为何有保存了32k的语音,保存的语音是用来做什么的?我想用16k的语音进行微调,不知道效果会不会有影响?

In follow-up

试了几个开源项目,这个项目整体效果很好,训练合成速度很快,但是有一个非常严重的问题,吞字严重,非常不可控,希望作者能在这方面再帮改进一下,非常有潜力!!!

对于国内用户,我可以把模型文件传到iCloud上,其他用户都可以以更快的速度下载,直接进网页就可以下载的那种,而且经测试是能够跑满宽带的,参考我在#165 中给出的项目下载链接,不知道作者是否需要?

In follow-up

``` "/Users/zilong/anaconda3/envs/GPTSoVits/bin/python" GPT_SoVITS/prepare_datasets/1-get-text.py Traceback (most recent call last): File "/Users/zilong/anaconda3/envs/GPTSoVits/lib/python3.9/site-packages/transformers/utils/hub.py", line 385, in cached_file Traceback (most recent call last): File "/Users/zilong/anaconda3/envs/GPTSoVits/lib/python3.9/site-packages/transformers/utils/hub.py", line 385, in cached_file resolved_file = hf_hub_download( resolved_file =...

非常棒的项目!请问大佬,有提供流式输出吗?

![image](https://github.com/RVC-Boss/GPT-SoVITS/assets/86220968/18045df3-14ef-4c09-ad51-fa3401362fbd) 搞了半天,我打標都打好了,結果來那麼掃興的通知 能用cpu訓練嗎?

![image](https://github.com/RVC-Boss/GPT-SoVITS/assets/51388802/4968e0ab-7a83-44fc-bb1c-9d43353fbe6b) ![image](https://github.com/RVC-Boss/GPT-SoVITS/assets/51388802/387d4c2f-6ef8-46d2-8a6c-fa8b29fe6d09) gpt训练卡顿,并且进度条不显示,占用率100%,这是为什么呢?(我的训练文件就两个,合起来1分钟左右)

在停顿处,如逗号、空格的地方,有较大的概率会出现电音,就是的声音,如何能避免呢? 声音如附件中所示 [tmp6ep7gbbl.zip](https://github.com/RVC-Boss/GPT-SoVITS/files/14084797/tmp6ep7gbbl.zip)

偶然发现可以用来帮“听不见但能说话”的人士矫正吐字发音,和大伙儿反馈一下 【我用AI帮助豚豚成为普通人 | 哈喽呀,豚豚请接受我的善意-哔哩哔哩】 https://b23.tv/BX6fxuy