GPT-SoVITS issues

必須把python.exe的優先順序調高，才能獲得較高的速度

各位大神晚安如題，小弟我電腦裡python.exe默認優先順序是標準，每次做訓練、推理時我必須到工作管理員手動把優先順序調高才能發揮GPU應有的速度，有點煩人，有人有一樣的問題嗎? 該如何解決呢?

有时候会返回空白音频?

![Image](https://github.com/user-attachments/assets/cc45346c-4172-4e16-8de0-8e2a96e00b55)如图所示,文件也有大小通过api试过通过gui网页也试过,有概率会出现试过v2模型和v4 都会这样是我模型没训练好吗,但是他还是有机会开口正常说话,,就是有概率会返回这种没有音频但是文件有大小

jwwsjlm

长时间运行推理，导致内存不释放，逐步增长直至占满所有内存空间，导致机器崩溃。

8

Ubuntu22 A10机器，进行单个worker 10h的压测，发现内存（64g）被占满。

0xCAFEBABE0

使用自训练模型API 报错：/api/modules HTTP/1. 1" 404 Not Found

6

为什么自己指定模型地址及参考音频、文本后，可以通过 9880/docs 进入 docs 界面，但是不能将 127.0.0.0:9880 这个填入其他应用中（例如koboldcpp），总是会报错HTTP/1. 1"404 Not Found”，求解！感谢！

Thelast0802

日语large3训练获得.list那一步会报错

1

Invalid handle. Cannot load symbol cudnnCreateTensorDescriptor Aborted (core dumped) 但是如果是中文的large就不会安装的是 pip install torch==2.5.1 torchaudio==2.5.1 --index-url https://download.pytorch.org/whl/cu118

GitTonb

我想调整个别字的生成时长和音高，哪里可以调整基频和时长预测呢？

类似pitch duration ，求各位大大解答！

tuoerye

5070TI ERROR: Exception in ASGI application Traceback (most recent call last): File "D:\anaconda\envs\gptsovits\lib\site-packages\starlette\responses.py", line 270, in __call__ await wrap(partial(self.listen_for_disconnect, receive)) File "D:\anaconda\envs\gptsovits\lib\site-packages\starlette\responses.py", line 266, in wrap await func() File "D:\anaconda\envs\gptsovits\lib\site-packages\starlette\responses.py",...

wanmugui

api_v2接口遇到INFO:logger:[WARN] audio sample rate is 32000, resampling into 16000.之后就特别慢，要好久才能出音频，有大佬知道原因吗

INFO:logger:gpt_sovits Time to first chunk: 1.6337940520024858s INFO:logger:[INFO]tts audio stream 32000: (110720,) INFO:logger:[WARN] audio sample rate is 32000, resampling into 16000. INFO:logger:chunk len:16259 INFO:logger:[INFO]tts audio stream 32000: (56960,) INFO:logger:[WARN] audio sample...

kkkwjr

请问有最新版本的docker吗？有v4版本的docker吗？

我导docker hub上看镜像是12个月之前的，请问有最新版的吗，或者那边有维护最新版的docker？

wowk2011

GPT-SoVITS
GPT-SoVITS copied to clipboard

Metadata

必須把python.exe的優先順序調高，才能獲得較高的速度

有时候会返回空白音频?

如何多GPU推理啊

长时间运行推理，导致内存不释放，逐步增长直至占满所有内存空间，导致机器崩溃。

使用自训练模型API 报错：/api/modules HTTP/1. 1" 404 Not Found

日语large3训练获得.list那一步会报错

我想调整个别字的生成时长和音高，哪里可以调整基频和时长预测呢？

Mecab初始化失败，之前用的好好的，V2版本的

api_v2接口遇到INFO:logger:[WARN] audio sample rate is 32000, resampling into 16000.之后就特别慢，要好久才能出音频，有大佬知道原因吗

请问有最新版本的docker吗？有v4版本的docker吗？

← Metadata

Owner

Metadata

GPT-SoVITS GPT-SoVITS copied to clipboard

Metadata

← Metadata

Owner

Metadata

GPT-SoVITS
GPT-SoVITS copied to clipboard