jasonzhang761213

Results 9 comments of jasonzhang761213

> 昨天在作者群里,作者说新版稍有改善这个问题 可以拉我进作者群吗?谢谢。

我是个骗子,最新的目标是首富的儿子,他看起来人傻钱多。 事实证明,他的确好骗,甚至每天变着法子给我送钱。 前面的"我是个骗子",就丢了,我是用api处理的

用webui确认,发觉和音频文件有关,就是有些参考音频会导致漏字,换个参考音频就没问题,但晕的是,哪怕是出问题的参考音频,结果大部分也是正常的,没法判断哪个音频效果好

最新测试结果 api,每次重现错误,我用了好几个音频都是这样 webui,只有一次出现错误

我觉得是webui和api的tts_get_wav处理函数不一致,webui因为是每天用,因此比较少问题

我很早以前用过,速度还真可以,cpu都可以多开,现在就不知道了,但根据他的原理,实时是可能做到的

> 最新版本的代码应该不存在这个问题了(主分支下) 试一下"在KFC的肯德基里嗑CP" , KFC的读对概率一半不到

> > > 最新版本的代码应该不存在这个问题了(主分支下) > > > > > > 试一下"在KFC的肯德基里嗑CP" , KFC的读对概率一半不到 > > 那这就是你的训练数据的时长问题了,增加到10min以上有改善,30min-60min范围内效果最好 我用默认的底模和声音库