gtcrn icon indicating copy to clipboard operation
gtcrn copied to clipboard

The official implementation of GTCRN, an ultra-lite speech enhancement model.

Results 22 gtcrn issues
Sort by recently updated
recently updated
newest added

请问README Tabel1 跟Tabel2 中的RNNoise 的MACs 是怎么统计的呢? 单计算网络部分的话,不会有0.04(G/s) 这么大的, 我按你代码中的统计方式,如果按帧长512,帧移256 计算出来的Macs 为5.53M (约0.0055 G/s), 如果按帧长320, 帧移160计算出来的Macs为8.74M (约0.0087 G/s)

你好!多谢你的工作及开源!如果我想使用48k采样率,需要对模型代码进行修改吗,还是只需要改变输入数据即可。 祝您工作顺利!

晓彬,您好: 非常感谢您的开源精神,我正在使用您开源的训练框架 SEtrain。 我发现训练出来的小参数网络在低信噪比场景下会出现降噪不干净,人声听感难受的问题。在尝试更换网络结构、更换mask、单独使用mse或sisnr均无明显改善,并且减小参数时问题更加明显。 您开源的本模型在处理低信噪比音频时同样会出现降噪不干净,听感难受的问题。您能否提出建议帮助解决这一问题。 期待回复,感谢!

Hi, what license is this code released under?

您好,恭喜您完成了一个非常棒的工作并且被ICASSP 2024 收录。关于Subband Feature Extraction这一块中,您使用了nn.Unfold的操作,我想请教一下这一块的设计思想和作用是什么?感谢您的回答!

首先非常感谢您的工作,我这里使用onnxsim.simplify导出时会报这个错 `RuntimeError: /project/third_party/onnx-optimizer/onnxoptimizer/passes/eliminate_shape_gather.h:48: runTransform: Assertion 'indices_val < dims.size()' failed.` 我和DeepVQE对比后排查了如下的地方: chunk改切片 转置卷积去掉 groups去掉 空洞卷积去掉 layernorm去掉 均没有排查到原因,还是报上述的错 请问您找到问题在哪了吗

我承认这个模型的速度已经非常快,但是在rk3566 四核心a55上,依然满足不了实时的要求 流式的模型单次推理16ms,端侧推理一次耗时14-16ms,再加上其他应用很容易就rtf>1了 有可能进一步减少模型的size吗?