GPT-SoVITS api和webui在相同模型配置下，效果不一致

api和webui在相同模型配置下，效果不一致

Open iloveming opened this issue 1 year ago • 3 comments

api的吞字现象比较严重，且念不了数字 webui正常

Feb 05 '24 06:02 iloveming

确实，我在用api推理较长文本(288字)，使用5句一切时，在整个文本的前段，中段和后段均出现了一次吞字情况，每次吞掉了8-12字符长的短句。

Feb 05 '24 13:02 karry12138

api里没有拆分字符的功能，调的也不是webui的方法，所以效果会不一样，参考两个文件的 get_tts_wav()方法。

Feb 06 '24 02:02 1713172499

(基于20240123我下载的win打包版) 我在api调用前把webui的split和cut等文本预处理的函数也塞进了api.py。对比了两者的get_tts_wav()方法后，除了webui为了能够灵活调参数而做出的修改，我没有看出太大的差异。两者在输入较长文本时或多或少都有点吞字，~~体感上api吞的略多一点~~ 订正，吞的基本一样多。不过数字都能正常念。

Feb 06 '24 03:02 karry12138

GPT-SoVITS GPT-SoVITS copied to clipboard

api和webui在相同模型配置下，效果不一致

GPT-SoVITS
GPT-SoVITS copied to clipboard