GPT-SoVITS
GPT-SoVITS copied to clipboard
api和webui在相同模型配置下,效果不一致
api的吞字现象比较严重,且念不了数字 webui正常
确实,我在用api推理较长文本(288字),使用5句一切时,在整个文本的前段,中段和后段均出现了一次吞字情况,每次吞掉了8-12字符长的短句。
api里没有拆分字符的功能,调的也不是webui的方法,所以效果会不一样,参考两个文件的 get_tts_wav()方法。
(基于20240123我下载的win打包版) 我在api调用前把webui的split和cut等文本预处理的函数也塞进了api.py。 对比了两者的get_tts_wav()方法后,除了webui为了能够灵活调参数而做出的修改,我没有看出太大的差异。 两者在输入较长文本时或多或少都有点吞字,~~体感上api吞的略多一点~~ 订正,吞的基本一样多。不过数字都能正常念。