MockingBird
MockingBird copied to clipboard
fmax 8000,会对模型有什么影响吗
想做小样本学习100样本左右,微调 tacotron 的 decoder 部分
#507
想知道fmax8000的话会对语音的相似度有什么影响吗,另外输出的这个 attention 图代表什么呢,横轴是步数,纵轴是attention,比如下面的这些输出该怎么分析呢,横轴代表步数的话为什么不是递增呢,这个图该怎么看呀
万分感谢!!希望可以深入交流

暂时没有办法提高数据量,可以保证单个微调的单个说话人的100个样本高质量,想知道在这种情况下有什么建议呢
暂时没有办法提高数据量,可以保证单个微调的单个说话人的100个样本高质量,想知道在这种情况下有什么建议呢
切割重组。