maoyapeng comments

Results 8 comments of


                                            maoyapeng

GTCRN实际上还是对幅度谱做mask？

> 您好：非常感谢您的开源模型。我目前正在基于您的模型进行一些测试，注意到GTCRN的输出通过tanh激活并预测实部和虚部的mask，对预测出来的mask与输入特征的实部虚部做了复数乘法得到了预测特征。而当我将虚部mask的值打印出来时，发现在大部分情况下，mask的值都是接近于0（大约在10^-3~10^-4或者更低)，我使用了两个checkpoints对test_wavs/mix.wav进行测试，以及使用了一些本地数据进行测试，基本都是这个现象。关于上述现象：1. GTCRN是否实际上已经退化成了幅度谱的mask。2. 如果确实发生了退化，这种退化的可能原因是什么，以及是否可以通过训练目标的选择，或者是模型的调整，将GTCRN的恢复到对CRM的估计？期待您的回复，谢谢！严验证的真细致呀

GTCRN实际上还是对幅度谱做mask？

特征按照这种方式，最后还是估计crm 嘛发自我的iPhone ------------------ 原始邮件 ------------------ 发件人: xiaoboss-ju ***@***.***> 发送时间: 2025年5月23日 17:08 收件人: Xiaobin-Rong/gtcrn ***@***.***> 抄送: maoyapeng ***@***.***>, Comment ***@***.***> 主题: Re: [Xiaobin-Rong/gtcrn] GTCRN实际上还是对幅度谱做mask？ (Issue #20)

maoyapeng

GTCRN实际上还是对幅度谱做mask？

GTCRN实际上还是对幅度谱做mask？

vs2022 x86下编译错误

端侧设备部署，onnx推理耗时20ms，是否正常以及还是否有优化手段

端侧设备部署，onnx推理耗时20ms，是否正常以及还是否有优化手段

端侧设备部署，onnx推理耗时20ms，是否正常以及还是否有优化手段

端侧设备部署，onnx推理耗时20ms，是否正常以及还是否有优化手段

端侧设备部署，onnx推理耗时20ms，是否正常以及还是否有优化手段