LiveTalking icon indicating copy to clipboard operation
LiveTalking copied to clipboard

TTS模型用的gpt-sovits,发现遇到下面的警告就会出现卡顿的问题。有知道怎么解决的么?

Open kkkwjr opened this issue 8 months ago • 6 comments

INFO:logger:[INFO]tts audio stream 32000: (104320,) INFO:logger:[WARN] audio sample rate is 32000, resampling into 16000. INFO:logger:------actual avg final fps:25.0022 INFO:logger:chunk len:25301 INFO:logger:[INFO]tts audio stream 32000: (92800,) INFO:logger:[WARN] audio sample rate is 32000, resampling into 16000. DEBUG:logger:sleep qsize=39 INFO:logger:chunk len:17025 INFO:logger:[INFO]tts audio stream 32000: (60800,) INFO:logger:[WARN] audio sample rate is 32000, resampling into 16000. INFO:logger:chunk len:19114 INFO:logger:[INFO]tts audio stream 32000: (68480,) INFO:logger:[WARN] audio sample rate is 32000, resampling into 16000.

kkkwjr avatar May 06 '25 02:05 kkkwjr

还有就是长时间调用api推理后就会卡顿。

kkkwjr avatar May 06 '25 02:05 kkkwjr

是啊, 感觉有很大优化空间

hm365x avatar May 23 '25 02:05 hm365x

gpt-sovits还用自己训练模型吗?

python app.py --transport webrtc --model wav2lip --avatar_id wav2lip256_avatar1 --tts gpt-sovits --TTS_SERVER http://127.0.0.1:9880 --REF_FILE ref.wav --REF_TEXT xxx 我是部署好gpt-sovits后,按照这个指导直接调用的,在数字人生成的声音和原声差别很大。

jfy-yan avatar May 23 '25 14:05 jfy-yan

我也是遇到这个问题。

linwoodpendleton avatar May 29 '25 13:05 linwoodpendleton

显卡性能不够,infer fps没到25以上。 tts服务单独部署会好一些

lipku avatar Jun 07 '25 01:06 lipku

显卡性能不够,infer fps没到25以上。 tts服务单独部署会好一些

你好,

Image

像这里为0%语音就会丢失谁知道为什么呀 调用gpt-sovits文本合语音时,当预测语义token和decodingEOS为0时,没有语音返回

2524271078 avatar Aug 25 '25 06:08 2524271078