GPT-SoVITS icon indicating copy to clipboard operation
GPT-SoVITS copied to clipboard

如何自定义读音,例如AI、BI读音奇怪问题

Open zhouxuan-home opened this issue 1 year ago • 6 comments

tts推理的时候,AI、BI等英文缩写读音很别扭,有开发优化解决的办法吗?

zhouxuan-home avatar Jun 25 '24 08:06 zhouxuan-home

可以尝试通过谐音解决 或者采用英文逗号例如:

,A,I,

Separatee avatar Jun 26 '24 07:06 Separatee

加了热词的配置,读音还是时好时坏。

laishujie avatar Jun 27 '24 02:06 laishujie

最新版本的代码应该不存在这个问题了(主分支下)

KamioRinn avatar Jul 03 '24 15:07 KamioRinn

最新版本的代码应该不存在这个问题了(主分支下)

试一下"在KFC的肯德基里嗑CP" , KFC的读对概率一半不到

jasonzhang761213 avatar Jul 17 '24 11:07 jasonzhang761213

最新版本的代码应该不存在这个问题了(主分支下)

试一下"在KFC的肯德基里嗑CP" , KFC的读对概率一半不到

那这就是你的训练数据的时长问题了,增加到10min以上有改善,30min-60min范围内效果最好

Separatee avatar Jul 17 '24 11:07 Separatee

最新版本的代码应该不存在这个问题了(主分支下)

试一下"在KFC的肯德基里嗑CP" , KFC的读对概率一半不到

那这就是你的训练数据的时长问题了,增加到10min以上有改善,30min-60min范围内效果最好

我用默认的底模和声音库

jasonzhang761213 avatar Jul 17 '24 12:07 jasonzhang761213