周晴

Results 4 issues of 周晴

看了ECAPA-TDNN for Multi-speaker Text-to-speech Synthesis这篇论文,我想在藏语上用ECAPA-TDNN实现多说话人的合成。但是我只有40个说话人,总共35小时的数据集。我看都是在英文和中文这样大的数据集下做的,那我可以用中文上的预训练的模型,然后在我的藏语上做微调,还是使用藏语数据集完全从头训练一个ECAPA-TDNN模型。不知道我的想法是否可行。希望大佬们给出一些建议!!!

Question

在代码中,我并没有找到从英文转到音素的代码,请问是直接用英文字母训练的吗

hi, When using my own data for training, the pitch and energy loss did not converge, and the Mel loss decreased to 1. The sampling rate of my data is...

When I use LJSpeech's 900000. pth. tar as a pre training model and fine tune my own data, I use model.load_state_dict(torch.load('./output/ckpt/LJSpeech/900000.pth.tar')) to load the pre trained model, but an error...