GPT-SoVITS icon indicating copy to clipboard operation
GPT-SoVITS copied to clipboard

1 min voice data can also be used to train a good TTS model! (few shot voice cloning)

Results 1028 GPT-SoVITS issues
Sort by recently updated
recently updated
newest added

api.py里面的可以用,但是有问题,而webui启动后推理用到的是另一个方法,我记得以前V2时是共用同一个方法的。最重要的是,现在不能微调了?用最新的代码报错,而以前可以微调的V2卡在了第一步那里,我记得以前V2有几个选项能选什么“32K”,“48K”的,现在没了估计是后面改的,但可能改了一半?哎,可惜了这么好的项目,现在问题那么多……

Hey team! Is there any plan about adding more languages? This stack works really amazing, if we could use it with more languages like european ones, would be truly amazing......

上集回顾:https://github.com/RVC-Boss/GPT-SoVITS/pull/898 环境相关:https://www.bilibili.com/opus/1121763814718570502 考虑到torch_musa的发展,对GPT-SoVITS进行较为完整的适配 不准备适配的项目: ~- S1训练~ - G2pW ~S1训练用的pytorch_lightning适配不能,直接不认musa backend~ G2pW问题在于MUSA目前没有在linux下能用的ONNX Backend 以上都使用CPU进行替代 适配优先级:V2系列 >> 其他 目前已完成 - [x] 预处理 - [x] V2系列S2训练 - [x] 推理 - [x] S1训练 无法适配:...

fastapi的web界面没有流式输出选项,看了get_tts_wav函数中也没有stream参数,如何启用流式输出,有大佬解答一下吗?

训练音频是白菜工厂大佬发的原神中文CV音频我这自己训练的,V4、V2系列都存在把“肿瘤坏死因子TNF阿尔法”读成“肿瘤坏死因子TNF minus 阿尔法”,为了避免读错我已经把希腊字母都换成中文了,推理时选用了“中英混合”,但是多个中文声优练出来的丹每次复现,麻烦大佬们有空改一下

在 v2 / v2Pro / v2ProPlus 版本的模型中,单词 “drive” 被错误地念作 “doctor”,但是dry,drove不会。

Traceback (most recent call last): File "/Users/sam/Downloads/GPT-SoVITS/runtime/lib/python3.9/site-packages/gradio/queueing.py", line 536, in process_events response = await route_utils.call_process_api( File "/Users/sam/Downloads/GPT-SoVITS/runtime/lib/python3.9/site-packages/gradio/route_utils.py", line 322, in call_process_api output = await app.get_blocks().process_api( File "/Users/sam/Downloads/GPT-SoVITS/runtime/lib/python3.9/site-packages/gradio/blocks.py", line 1935, in...