ChrisWang10
Results
1
comments of
ChrisWang10
> mask为1的地方,就是最大索引的地方。不过确实只是计算了最大值的那个位置上的梯度,没有把非最大值部分叠加到最大值部分上去。这个地方要把非最大值部分的梯度叠加到最大值位置去,后面还要改一下。多谢指教,如不介意,微信交流wl1647855685 > […](#) > ------------------ 原始邮件 ------------------ 发件人: "xujiao3628"; 发送时间: 2019年5月5日(星期天) 下午3:22 收件人: "makalo/CornerNet"; 抄送: "Makalo"; "Comment"; 主题: Re: [makalo/CornerNet] pool梯度的反向传播,逻辑是不是理解错了,感觉和原版的不太一样 (#14) 我看的pytorch源码实现,反向传播的时候,梯度的值需要散落(scatter)到输入最大值的索引位置(和前向的逻辑一致),这样散落之后,梯度的值只会传播到有限的几个位置,并且会叠加(因为最大值只有有限几个)。而你的实现,是直接计算了梯度的一个mask,梯度原位传播(没有传播到索引最大位置) 其实原理和max pool有一点类似,即梯度传递到输入最大值的位置 — You are receiving...