xf comments

Results 3 comments of

xf

ViG如何将节点构成特征向量

> stem的操作也可以分为2步： > > 1. 224x224的图片切分成56*56个15x15的patch（每个patch有一定的重叠）； > 2. 对每个7x7的patch进行stem卷积操作输出1个768维的向量。论文中的Table 2，是不是可以这么理解: Output size为节点的个数，D为节点特征向量长度？

> > > 4. 标注都不会保存到原文件的，标注数据保存在books-data下的xml文件中 > > > > > > 关于这一点，有没有将来支持把高亮和注释保存到 PDF 文件的可能呢？假如能支持就太好了，因为这样方便和其他人交流注释了的 PDF 文件，也方便在合适的场景下用普通 PDF 阅读器查看高亮和注释。 > > 会有导出，但是应该不会直接保存到pdf里。我试了一下，导出有高亮和注释，但高亮时不注释的话，它导出的会带有注释，即高亮的这部分内容作为注释。同时还有"PDFTRON"水印

图像patch

你好，我有3个问题： 1. 你们是否试过ViT划分patch的方法？有的话对比效果如何？ 3. 论文的_Figure 4: Visualization of the constructed graph structure._ (b)中显示第1个和第12个block都是14x14个节点，但根据ViG-Ti结构，第1个和第12个block的节点数应是56x56、7x7，对应不上14x14，如何理解？ 4. 论文的_Figure 3: Feature diversity of nodes as layer changes._这个图是怎么计算的？需要用到什么数据集来计算吗？望解答，谢谢！

xf

ViG如何将节点构成特征向量

几点建议

图像patch