LazyNam
LazyNam
这几天细读了一下您的代码,为您的工程能力架构设计感到佩服。有几个问题想请问下您: 1. inference.toml中look ahead的参数,这一点体现在fullsubnetplus的nn.Module模块中,forward的输出。关于这个参数有什么意义,您论文中写到“look ahead represents the length of future information”,我还是不太明白。。 2. 论文中您对网络结构做了图解,其中经过unfold操作的只有经过MulCA模块的幅度谱,但源码中最后您是将所有经过MulCA模块的实部谱,虚部谱都unfold之后再拼接的: ```python sb_input = torch.cat([noisy_mag_unfolded, fb_output_unfolded, fbr_output_unfolded, fbi_output_unfolded], dim=2) sb_input = self.norm(sb_input) ``` 这样效果是会更好吗,还是开源版本跟论文版有出入。 4. 关于TCN模块,其中有个DD-Conv结构,您也给出了解释,按照我的理解应该是个深度可分离卷积,但代码好像使用conv1d就实现了,我的理解应该还是标准卷积: ```python self.depthwise_conv...
该校准集合是需要一堆图片,通过Opencv的imread读取生成RGB三通道或者Gray单通道。 以Pytorch_DTLN_P1_stateful这个类为例,我也想过将输入的mag转化成图片存入JPEG格式中构造校准数据集,但是mag的值跟图片的值他们的值域不一样啊,这条路好像是走不通的。