Matrix-Capsules-EM-PyTorch icon indicating copy to clipboard operation
Matrix-Capsules-EM-PyTorch copied to clipboard

请问 coor_add 的作用是什么?

Open CBLBY opened this issue 5 years ago • 1 comments

CBLBY avatar Dec 09 '19 13:12 CBLBY

Paper 第四页有详细说明,这篇博客中也有一些介绍。我对这个领域不熟悉,我的理解是这样的:作者想要让相同类型的capsule处理相同类型的entity,但同时又想要保留位置的信息,使得不同位置output的值不同,所以把坐标加进vote matrix。

我觉得也可以类比于conv来理解,比如一张image上有4个车轮,那这4个车轮可以用同样的conv来提取特征,这是卷积核的局部共享。capsule在最后一层的时候,既想要有这种共享的transformation,同时也想encode位置信息,所以采用了Coordinate Addition的技术。作者在Table 1的实验表明(对比Row.3和Row.6),使用这个技术的效果是有提升的。

这是我的理解,欢迎讨论。

yl-1993 avatar Dec 12 '19 12:12 yl-1993