Rong Xiaobin comments

Results 68 comments of


                                            Rong Xiaobin

LIcense?

Thanks for your kind reminder, I will add it later~

请问您排查到onnxsim.simplify导出时的问题所在了吗

@SherryYu33 由于最近忙别的事情，后续就没有继续排查错误了。非常感谢你的工作！可能是由于onnxsim对一些算子不支持。后续我会根据你所说的来修正代码，再次感谢！

谢谢你的支持！ Unfold操作被用来实现子带单元的划分。它的基本思想是，认为相邻频带的信息对当前频带的增强具有重要作用。把一个频带及其相邻的若干频带共同视为一个子带单元，通过unfold来实现子带单元的划分。然后将子带单元在通道维度堆叠起来，从而将频域的信息融合到通道维度，有利于后续的卷积等操作更高效地利用频域信息。这一设计在 **FullSubNet** (Hao X, Su X, Horaud R, et al. Fullsubnet: A full-band and sub-band fusion model for real-time single-channel speech enhancement[C]//ICASSP 2021-2021 IEEE International Conference on Acoustics,...

提问，关于SFE模块使用nn.unfold的目的。

@TungyuYoung Conv2d模块固然可以处理相邻频带的关系，但其在时间维度上是局部的（只能处理卷积核内的帧之间的依赖关系），unfold操作则是对时间维度上的所有帧并行地操作。第二个问题，TRA 模块没有一个显式的基频提取的设计。文章预计三月中旬将会见刊，欢迎你持续的关注！

提问，关于SFE模块使用nn.unfold的目的。

@HuixiangH 您好，我认同你说的SFE+1x1 conv等价于kx1 conv的观点；但是SFE+conv是否等价于conv我还需要再思考。感谢您的意见

where is the INFO.csv

`INFO.csv` looks like this: ![image](https://github.com/user-attachments/assets/742555b9-65fc-4f3a-8738-f1cb68416ced)

about the feature extraction

Hi, I think the codes below actually play the role of power law compressing. ``` x_mag = torch.sqrt(x[...,[0]]**2 + x[...,[1]]**2 + 1e-12) x_c = torch.div(x, x_mag.pow(1-self.c) + 1e-12) ``` Actually,...

about the feature extraction

Thank you for your appreciation, and I'm glad to keep in touch with you

offline和online推理速度差异

online 版本比 offline 慢是合理的，考虑卷积的 online 和 offline 两种形式，前者实际上相当于写了一个 for 循环来处理数据，而后者直接对数据进行并行处理。如果考虑 RNN 的 online/offline 的话，虽然不能并行处理，但是后者的 pytorch 实现是用 C代码写的，所以还是会快。

hz2ERB的系数

你好，据这篇博客文章（https://www.cnblogs.com/LXP-Never/p/16011229.html#blogTitle6 ），两种近似公式相差无几。