gtcrn
gtcrn copied to clipboard
关于输入特征会导致性能下降的问题
亲爱的作者, 为了进一步缩小模型和降低计算量,我尝试了仅用 spec.abs() 和 spec.angle() 作为输入,最终的增强频谱直接通过 spec*mask 得到。其余网络架构均不作改变。然而我发现这样做会导致生成的音频会丢失中高频的细节。请问您有尝试过不同的输入特征吗? Thanks!