MockingBird icon indicating copy to clipboard operation
MockingBird copied to clipboard

中英模型怎么训练

Open weisliey opened this issue 2 years ago • 5 comments

想要同时支持中文和英文的播报,怎么训练模型啊?

weisliey avatar Feb 21 '23 05:02 weisliey

最近开发精力不太够,只能提供个思路,目前字幕都处理成拼音了,所以只支持中文,最好是可转成ipa等音素格式,然后属于中英夹杂的语料

babysor avatar Feb 21 '23 16:02 babysor

是把中文训练集的拼音转成ipa的格式吗?能提供一个简单的中英混合的训练数据格式看看吗?后面需要训练的数据自己整理。

weisliey avatar Feb 22 '23 01:02 weisliey

最近开发精力不太够,只能提供个思路,目前字幕都处理成拼音了,所以只支持中文,最好是可转成ipa等音素格式,然后属于中英夹杂的语料

大佬,我尝试用了aishell3的中文数据和train-clean-100的英文数据混合训练了,能播报中英文混合的,但是有漏读、合成的最后会多出来一点杂音,大佬能指点一下,怎么消除杂音么?下面是我加载的模型 image

weisliey avatar Feb 28 '23 01:02 weisliey

也想了解如何中英文数据混合训练?

aidec avatar Mar 18 '23 16:03 aidec

现在怎么样了

sguo112 avatar Dec 19 '24 07:12 sguo112