GPT-SoVITS Error preparing audio payload: Audio is empty or all zero.
按照教程 https://www.bilibili.com/video/BV1tnPMeKEGx 部署后出现的问题,表现如下:
- 无法正常输出AI语音(默认的Edge TTS是没有问题的)
- 当对话中出现一些短促的语气词,例如“啊、诶、嗯”,语音可以正常工作,但长度适中的句子就不行。
配置:
- NVIDIA Driver 572.61 + CUDA 12.8 (NVIDIA GTX 1660 Ti)
- LLM模型:deepseek-llm
- 其它配置均与教程一致
OpenLLM 运行截图:
GPT-SoVITS 运行截图:
verbose log: debug.log
补充一点:在 web-tool 下运行时,TTS 同样会报错:
Failed to execute 'createBuffer' on 'BaseAudioContext': The number of frames provided (0) is less than or equal to the minimum bound (0).
部分运行截图如下:
大概率是你的 GPTSoVITS 的配置有误?你是否检查过是否能直接播放 cache/ 下的音频?
大概率是你的 GPTSoVITS 的配置有误?你是否检查过是否能直接播放 cache/ 下的音频?
不能,cache folder下生成的都是十分短的空音频,无法正常播放。 配置部分都是按照教程的指示去做的,后来又重新配置了一遍还是同样的问题,每次音频生成都是跑到1%-5%就直接停止了,像是因为超时或者其他什么原因而被“掐断”了一样。
你可以试试用GPT-Sovits的webui进行音频生成测试,如果官方的webui没问题再进行反馈,这一步是为了检测你的模型配置有无问题,理论上只要webui能正常生成音频放到项目里是能用的