GPT-SoVITS icon indicating copy to clipboard operation
GPT-SoVITS copied to clipboard

推理了一个晚上,发现会卡顿

Open zecak opened this issue 1 year ago • 4 comments

版本:0306fix2 推理了一个晚上,python占用6个G左右, 每次生成音频都变得很卡,得关闭,重新打开才正常 模型和参考音频都没变

zecak avatar Jun 10 '24 02:06 zecak

为了更快的速度,可以:

git clone --depth=1 -b fast_inference_ https://github.com/RVC-Boss/GPT-SoVITS.git fast_inference

不会使用git可以直接在浏览器里打开这个链接 然后把刚刚得到的目录除了.git和docker的所有文件覆盖到GPT-SoVITS主目录 再按你的方式使用pip 因为你用的是整合包,所以我顺带着把命令改一下: 打开主目录,在地址栏中输入cmd 输入以下命令

.\runtime\python -m pip install wordsegment -i https://pypi.tuna.tsinghua.edu.cn/simple

有了新版本的加持,你的推理速度应该会很快。

Separatee avatar Jun 10 '24 06:06 Separatee

楼主定位到了卡点在哪吗

顺便抄送@ChasonJiang 如果有空可以看看

RVC-Boss avatar Jun 10 '24 08:06 RVC-Boss

楼主定位到了卡点在哪吗

顺便抄送@ChasonJiang 如果有空可以看看

我用工具一直调用api,跑久了就会变得很卡,但能用。具体真不知道是哪出问题。只要关闭运行的python,重新运行调用推理,才正常

zecak avatar Jun 10 '24 08:06 zecak

INFO:logger:[INFO]tts audio stream 32000: (104320,) INFO:logger:[WARN] audio sample rate is 32000, resampling into 16000. INFO:logger:------actual avg final fps:25.0022 INFO:logger:chunk len:25301 INFO:logger:[INFO]tts audio stream 32000: (92800,) INFO:logger:[WARN] audio sample rate is 32000, resampling into 16000. DEBUG:logger:sleep qsize=39 INFO:logger:chunk len:17025 INFO:logger:[INFO]tts audio stream 32000: (60800,) INFO:logger:[WARN] audio sample rate is 32000, resampling into 16000. INFO:logger:chunk len:19114 INFO:logger:[INFO]tts audio stream 32000: (68480,) INFO:logger:[WARN] audio sample rate is 32000, resampling into 16000.

我发现好像也是推理了很久,然后卡顿,并且出现了上面的信息也会卡顿

kkkwjr avatar May 06 '25 02:05 kkkwjr