GPT-SoVITS icon indicating copy to clipboard operation
GPT-SoVITS copied to clipboard

BUG:API调用和UI使用结果不一致(发现babylon这个词无法正确生成音频)

Open BOCEAN-FENG opened this issue 9 months ago • 8 comments

补充:尝试重复生成50轮同一段音频,发现音频的时长会越来越长,比如'zzzzzzz'的声音会越来越长,考虑到程序有什么内存使用问题?

fast_inferenceAPI(api_v2.py)调用,webui直接合成就没有问题,两者保持参数一致,包括种子在内 尝试过五段参考音频,包括底模在内换了三种模型,各种生成参数都调整了 发现babylon会生成babylonzzzzzzzzzzzzzzzzzzzzzzzszsz这种发音,为什么会有这种情况呢?

BOCEAN-FENG avatar May 13 '24 09:05 BOCEAN-FENG