朱良俊
朱良俊
Visualization 0.7.0 Suggestion: Add a language 1D attention visualization.
看了源码部分,很奇怪,感觉和论文的损失很不一样。 segm 的输入:pred (2(batch)*h*w, 148) 148 指的是(36+1)*4 target (2(batch)*h*w, 74*2) 期待作者能回复一下,感谢~
> @Zlj-github > 36+1其中36是指每个anchor点预测36根向量,1是指每个anchor点还额外预测了1个向量,这个向量指向物体的几何中心点,该向量可以作为DCN的其中一个offset,因此可以把几何中心点附近的特征给提取到(文章只说了利用DCN提取极值点附近的特征,实际这一版代码中还同时提取了几何中心点附近特征)。至于target (2(batch)hw, 742)中的742在哪个地方?应该也是742 谢谢回复,742是打字没有注意符号 74 * 2, 74 =(36+1)*2, *2 应该有x,y坐标,所以*2,但是另外一个*2怎么理解呢?是论文中取0.2倍后的4维坐标系嘛? 还有源码里面这个地方: loss = 1 - (overlaps - (rho2 / c2 + v**2 / (1 - overlaps...
感谢作者大大~