Rong Xiaobin
Rong Xiaobin
Thanks for your kind reminder, I will add it later~
@SherryYu33 由于最近忙别的事情,后续就没有继续排查错误了。非常感谢你的工作!可能是由于onnxsim对一些算子不支持。后续我会根据你所说的来修正代码,再次感谢!
谢谢你的支持! Unfold操作被用来实现子带单元的划分。它的基本思想是,认为相邻频带的信息对当前频带的增强具有重要作用。把一个频带及其相邻的若干频带共同视为一个子带单元,通过unfold来实现子带单元的划分。然后将子带单元在通道维度堆叠起来,从而将频域的信息融合到通道维度,有利于后续的卷积等操作更高效地利用频域信息。 这一设计在 **FullSubNet** (Hao X, Su X, Horaud R, et al. Fullsubnet: A full-band and sub-band fusion model for real-time single-channel speech enhancement[C]//ICASSP 2021-2021 IEEE International Conference on Acoustics,...
@TungyuYoung Conv2d模块固然可以处理相邻频带的关系,但其在时间维度上是局部的(只能处理卷积核内的帧之间的依赖关系),unfold操作则是对时间维度上的所有帧并行地操作。 第二个问题,TRA 模块没有一个显式的基频提取的设计。 文章预计三月中旬将会见刊,欢迎你持续的关注!
@HuixiangH 您好,我认同你说的SFE+1x1 conv等价于kx1 conv的观点;但是SFE+conv是否等价于conv我还需要再思考。感谢您的意见
`INFO.csv` looks like this: 
Hi, I think the codes below actually play the role of power law compressing. ``` x_mag = torch.sqrt(x[...,[0]]**2 + x[...,[1]]**2 + 1e-12) x_c = torch.div(x, x_mag.pow(1-self.c) + 1e-12) ``` Actually,...
Thank you for your appreciation, and I'm glad to keep in touch with you
online 版本比 offline 慢是合理的,考虑卷积的 online 和 offline 两种形式,前者实际上相当于写了一个 for 循环来处理数据,而后者直接对数据进行并行处理。如果考虑 RNN 的 online/offline 的话,虽然不能并行处理,但是后者的 pytorch 实现是用 C代码写的,所以还是会快。
你好,据这篇博客文章(https://www.cnblogs.com/LXP-Never/p/16011229.html#blogTitle6 ),两种近似公式相差无几。