GPT-SoVITS icon indicating copy to clipboard operation
GPT-SoVITS copied to clipboard

api和webui在相同模型配置下,效果不一致

Open iloveming opened this issue 1 year ago • 3 comments

api的吞字现象比较严重,且念不了数字 webui正常

iloveming avatar Feb 05 '24 06:02 iloveming

确实,我在用api推理较长文本(288字),使用5句一切时,在整个文本的前段,中段和后段均出现了一次吞字情况,每次吞掉了8-12字符长的短句。

karry12138 avatar Feb 05 '24 13:02 karry12138

api里没有拆分字符的功能,调的也不是webui的方法,所以效果会不一样,参考两个文件的 get_tts_wav()方法。

1713172499 avatar Feb 06 '24 02:02 1713172499

(基于20240123我下载的win打包版) 我在api调用前把webui的split和cut等文本预处理的函数也塞进了api.py。 对比了两者的get_tts_wav()方法后,除了webui为了能够灵活调参数而做出的修改,我没有看出太大的差异。 两者在输入较长文本时或多或少都有点吞字,~~体感上api吞的略多一点~~ 订正,吞的基本一样多。不过数字都能正常念。

karry12138 avatar Feb 06 '24 03:02 karry12138