SA-Net icon indicating copy to clipboard operation
SA-Net copied to clipboard

shuffle的作用

Open yzk-lab opened this issue 3 years ago • 3 comments

作者,你好,我看到论文里是将最后的子特征进行aggregation之后再进行shuffle,那么这个shuffle就只是一个单纯改变通道顺序的作用吗?按我理解,单纯改变通道顺序没有什么对特征的改进。所以这个channel shuffle的作用具体是什么呢?因为我最后shuffle后的特征图还想要利用,但是我感觉这个shuffle似乎没有什么作用呢?谢谢你的解答!

yzk-lab avatar May 24 '21 08:05 yzk-lab

很抱歉现在才有时间回复.SA先进行分组的目的是假设每一个子组学到的特征是类似的,然而这个假设虽然能够有效地降低计算量,实际运行中并不一定完全正确,因此在aggregation之后进行shuffle操作,这样在下一次分组后每个子组要处理的特征和并不是全部来自上一个stage同样编号的分组.这样做的好处是不同子组的特征之间也进行了一定的信息交互.

wofmanaf avatar May 29 '21 03:05 wofmanaf

感谢您的回复。但是,我似乎只有看到最开始对整个特征图进行一次分组的操作,没有体现多次分组shuffule再合并再分组的操作呀,而且shuffle操作只是在最后aggregation后的整个特征图上打乱通道顺序,这能起到特征交互的作用吗?我们最后利用的特征还是所有的特征,不过是顺序不同。还是我理解错了呢?不好意思。打扰了。

------------------ 原始邮件 ------------------ 发件人: "wofmanaf/SA-Net" @.>; 发送时间: 2021年5月29日(星期六) 中午11:47 @.>; @.@.>; 主题: Re: [wofmanaf/SA-Net] shuffle的作用 (#11)

很抱歉现在才有时间回复.SA先进行分组的目的是假设每一个子组学到的特征是类似的,然而这个假设虽然能够有效地降低计算量,实际运行中并不一定完全正确,因此在aggregation之后进行shuffle操作,这样在下一次分组后每个子组要处理的特征和并不是全部来自上一个stage同样编号的分组.这样做的好处是不同子组的特征之间也进行了一定的信息交互.

— You are receiving this because you authored the thread. Reply to this email directly, view it on GitHub, or unsubscribe.

yzk-lab avatar May 29 '21 08:05 yzk-lab

因为每个block有个残差连接的操作,所以在一定程度上可以认为是起到了特征交互的作用。也可以尝试多次分组shuffle合并的操作,通过实验确定有没有作用

wofmanaf avatar May 31 '21 02:05 wofmanaf