GPT-SoVITS icon indicating copy to clipboard operation
GPT-SoVITS copied to clipboard

一句里面,丢字现象还是很严重,就像抽卡

Open jasonzhang761213 opened this issue 1 year ago • 12 comments

一句里面,丢字现象还是很严重,就像抽卡 重新抽也没啥,但是就是很难判断哪句有问题

jasonzhang761213 avatar Jul 17 '24 07:07 jasonzhang761213

我是个骗子,最新的目标是首富的儿子,他看起来人傻钱多。 事实证明,他的确好骗,甚至每天变着法子给我送钱。

前面的"我是个骗子",就丢了,我是用api处理的

jasonzhang761213 avatar Jul 17 '24 07:07 jasonzhang761213

用webui确认,发觉和音频文件有关,就是有些参考音频会导致漏字,换个参考音频就没问题,但晕的是,哪怕是出问题的参考音频,结果大部分也是正常的,没法判断哪个音频效果好

jasonzhang761213 avatar Jul 17 '24 09:07 jasonzhang761213

最新测试结果 api,每次重现错误,我用了好几个音频都是这样 webui,只有一次出现错误

jasonzhang761213 avatar Jul 17 '24 09:07 jasonzhang761213

我觉得是webui和api的tts_get_wav处理函数不一致,webui因为是每天用,因此比较少问题

jasonzhang761213 avatar Jul 17 '24 11:07 jasonzhang761213

我觉得是webui和api的tts_get_wav处理函数不一致,webui因为是每天用,因此比较少问题

请问有将api的tts_get_wav改为webui的tts_get_wav吗?效果有没有提升?

ysujiang avatar Jul 24 '24 03:07 ysujiang

看了一眼,似乎是同一个函数,但是top_k默认值不同 函数默认参数是20,web会指定成5,api用了默认值的20

qjxkid avatar Jul 24 '24 05:07 qjxkid

是的,比较新的这个版本,丢字确实严重,而且是开头丢字。

lckj2009 avatar Jul 24 '24 06:07 lckj2009

看了一眼,似乎是同一个函数,但是top_k默认值不同 函数默认参数是20,web会指定成5,api用了默认值的20

改完top_k后效果有提升吗?

ysujiang avatar Jul 24 '24 06:07 ysujiang

看了一眼,似乎是同一个函数,但是top_k默认值不同 函数默认参数是20,web会指定成5,api用了默认值的20

改完top_k后效果有提升吗?

我打印了下config里的top_k,默认也是5,但是也有开头吞字的情况,这个有别的解决办法吗?

Lyzin avatar Aug 02 '24 15:08 Lyzin

蹲一下结果,有同样的问题

hxb112266 avatar Dec 03 '24 03:12 hxb112266

蹲一下结果,有同样的问题

这个问题解决了吗

F5Psyche avatar Apr 24 '25 13:04 F5Psyche

一样的结果,一句话20字,能丢5个严重时候10个

masterluozhi avatar Oct 30 '25 14:10 masterluozhi