FcaNet 请问一下这个模块在分割的时候如何设置dct_h和dct

请问一下这个模块在分割的时候如何设置dct_h和dct_w?

Open nnoyuwan opened this issue 3 years ago • 2 comments

输入要经过下采样和上采样，输入图片也就需要缩小和放大好几次，那我是不是要在__init__就把input size传进去，有什么办法能实时获取输入大小吗？

我有尝试在forward函数里获取x的大小，但后面训练很慢，我就意识到dct应该需要在搭建网络时预生成。

Oct 19 '21 12:10 nnoyuwan

@nnoyuwan 我们在检测的模型中考虑到了这个问题，其实这个大小只是一个“参考大小”，并不一定是要和输入一样的。具体的代码可以看这个地方： https://github.com/cfzd/FcaNet/blob/aa5fb63505575bb4e4e094613565379c3f6ada33/model/layer.py#L54-L55 如果输入大小和DCT大小不一样的话，我们会先做个resize然后在提取DCT频谱，而且resize只对应提取频谱，不会对输入特征造成任何影响。

其实也有个简单的办法，你可以把所有的dct_w和dct_h统统都设置为7，不用考虑输入大小的问题。

Oct 20 '21 06:10 cfzd

谢谢

Oct 20 '21 13:10 nnoyuwan

FcaNet FcaNet copied to clipboard

请问一下这个模块在分割的时候如何设置dct_h和dct_w?

FcaNet
FcaNet copied to clipboard