GPT-SoVITS
GPT-SoVITS copied to clipboard
1 min voice data can also be used to train a good TTS model! (few shot voice cloning)
各位大神晚安 如題,小弟我電腦裡python.exe默認優先順序是標準,每次做訓練、推理時我必須到工作管理員手動把優先順序調高才能發揮GPU應有的速度,有點煩人,有人有一樣的問題嗎? 該如何解決呢?
如图所示,文件也有大小 通过api试过 通过gui网页也试过,有概率会出现 试过v2模型和v4 都会这样 是我模型没训练好吗,但是他还是有机会开口正常说话,,就是有概率会返回这种 没有音频 但是文件有大小
Ubuntu22 A10机器,进行单个worker 10h的压测,发现内存(64g)被占满。
为什么自己指定模型地址及参考音频、文本后,可以通过 9880/docs 进入 docs 界面,但是不能将 127.0.0.0:9880 这个填入其他应用中(例如koboldcpp),总是会报错HTTP/1. 1"404 Not Found”,求解!感谢!
Invalid handle. Cannot load symbol cudnnCreateTensorDescriptor Aborted (core dumped) 但是如果是中文的large就不会 安装的是 pip install torch==2.5.1 torchaudio==2.5.1 --index-url https://download.pytorch.org/whl/cu118
类似pitch duration ,求各位大大解答!
5070TI ERROR: Exception in ASGI application Traceback (most recent call last): File "D:\anaconda\envs\gptsovits\lib\site-packages\starlette\responses.py", line 270, in __call__ await wrap(partial(self.listen_for_disconnect, receive)) File "D:\anaconda\envs\gptsovits\lib\site-packages\starlette\responses.py", line 266, in wrap await func() File "D:\anaconda\envs\gptsovits\lib\site-packages\starlette\responses.py",...
INFO:logger:gpt_sovits Time to first chunk: 1.6337940520024858s INFO:logger:[INFO]tts audio stream 32000: (110720,) INFO:logger:[WARN] audio sample rate is 32000, resampling into 16000. INFO:logger:chunk len:16259 INFO:logger:[INFO]tts audio stream 32000: (56960,) INFO:logger:[WARN] audio sample...
我导docker hub上看镜像是12个月之前的,请问有最新版的吗,或者那边有维护最新版的docker?