KollyYang
KollyYang
Hi @Emrys365 Thank you very much for adding the code related to TSE, so that we can easily run a TSE training model, But there is currently only Time-domain SpeakerBeam...
你好 看了你的论文,您的算法取得效果实在是太好了,非常想实现它。 主体结构比较像 GCRN-complex 这个项目,但是对你的VAD module 不太理解。   这两个好像对应不上? 1. table 中好像比 流程图中多了一个 reshape? 2. table 第一个 F-Dense Hyper Params (9,16)是什么意思? 3. 流程图中的H和G 能直接元素相乘吗?两个矩阵的维度都不一样? 4. 能否开源这部分的代码实现? 谢谢!
你好 @wangtianrui 非常感谢,开放这么好的文章和代码,文章的结果表明这个模型具有非常好的结果同时又有较小的参数和运行量,很适合在现实中使用,对此非常感兴趣。 我看完文章对整个 loss 部分很迷惑,觉得这部分很复杂,看文章loss是由4个部分组成的,包括你发明的APC-SNR(你的另外一个开源工程),你能把文章的 loss部分代码也开源吗? 谢谢!