GPT-SoVITS MRTE的方案问题

MRTE的方案问题

Open Jiang-Stan opened this issue 1 year ago • 1 comments

我看Mega-TTS2中提的MRTE是文本作Q，音频作KV，但在SoVITS的实现中是音频作Q，文本作KV，然后结果再加上音频的Embedding和global embedding，请问这里是有做过对比试验效果更好吗？

Feb 04 '24 06:02 Jiang-Stan

对比过去掉MRTE，有MRTE咬字更好。

Feb 04 '24 06:02 RVC-Boss