LiveTalking musetalk模型用gpt-sovits 音频播放出来有滋滋的声音

musetalk模型用gpt-sovits时图像正常推送，音频播放出来是滋滋的声音，gpt-sovits是用的流式ogg格式返回, 返回的全是滋滋的声音，后来改成非流式返回wav格式的声音能出来但是有点卡顿和声音不是很清楚顺便说下最近的gpt-sovits的api服务请求地址和入参有调整： @lipku

Jul 24 '24 03:07 sj123sheng

gpt-sovits使用全精度开启服务 musetalk的音色好很多也清楚很多跟这段将字节流转换为浮点数流有关系吗看用的全精度浮点数来转换的我这边gpt-sovits使用半精度这边也改成半精度音色效果也好很多

Jul 26 '24 08:07 sj123sheng

用raw格式返回

Jul 26 '24 11:07 lipku

gpt-sovits好像不支持raw格式返回的，需要自己去修改gpt-sovits代码支持raw格式返回吗我尝试了下raw的流式返回是可以的但是感觉音质还是没有sovits直接返回的好

Jul 29 '24 02:07 sj123sheng