TTS模型用的gpt-sovits,发现遇到下面的警告就会出现卡顿的问题。有知道怎么解决的么?
INFO:logger:[INFO]tts audio stream 32000: (104320,) INFO:logger:[WARN] audio sample rate is 32000, resampling into 16000. INFO:logger:------actual avg final fps:25.0022 INFO:logger:chunk len:25301 INFO:logger:[INFO]tts audio stream 32000: (92800,) INFO:logger:[WARN] audio sample rate is 32000, resampling into 16000. DEBUG:logger:sleep qsize=39 INFO:logger:chunk len:17025 INFO:logger:[INFO]tts audio stream 32000: (60800,) INFO:logger:[WARN] audio sample rate is 32000, resampling into 16000. INFO:logger:chunk len:19114 INFO:logger:[INFO]tts audio stream 32000: (68480,) INFO:logger:[WARN] audio sample rate is 32000, resampling into 16000.
还有就是长时间调用api推理后就会卡顿。
是啊, 感觉有很大优化空间
gpt-sovits还用自己训练模型吗?
python app.py --transport webrtc --model wav2lip --avatar_id wav2lip256_avatar1 --tts gpt-sovits --TTS_SERVER http://127.0.0.1:9880 --REF_FILE ref.wav --REF_TEXT xxx 我是部署好gpt-sovits后,按照这个指导直接调用的,在数字人生成的声音和原声差别很大。
我也是遇到这个问题。
显卡性能不够,infer fps没到25以上。 tts服务单独部署会好一些
显卡性能不够,infer fps没到25以上。 tts服务单独部署会好一些
你好,
像这里为0%语音就会丢失谁知道为什么呀 调用gpt-sovits文本合语音时,当预测语义token和decodingEOS为0时,没有语音返回