gtcrn
gtcrn copied to clipboard
GTCRN实际上还是对幅度谱做mask?
您好: 非常感谢您的开源模型。 我目前正在基于您的模型进行一些测试,注意到GTCRN的输出通过tanh激活并预测实部和虚部的mask,对预测出来的mask与输入特征的实部虚部做了复数乘法得到了预测特征。 而当我将虚部mask的值打印出来时,发现在大部分情况下,mask的值都是接近于0(大约在10^-3~10^-4或者更低),我使用了两个checkpoints对test_wavs/mix.wav进行测试,以及使用了一些本地数据进行测试,基本都是这个现象。 关于上述现象:1. GTCRN是否实际上已经退化成了幅度谱的mask。2. 如果确实发生了退化,这种退化的可能原因是什么,以及是否可以通过训练目标的选择,或者是模型的调整,将GTCRN的恢复到对CRM的估计? 期待您的回复,谢谢!