xf
xf
> stem的操作也可以分为2步: > > 1. 224x224的图片切分成56*56个15x15的patch(每个patch有一定的重叠); > 2. 对每个7x7的patch进行stem卷积操作输出1个768维的向量。 论文中的Table 2,是不是可以这么理解: Output size为节点的个数,D为节点特征向量长度?
> > > 4. 标注都不会保存到原文件的,标注数据保存在books-data下的xml文件中 > > > > > > 关于这一点,有没有将来支持把高亮和注释保存到 PDF 文件的可能呢?假如能支持就太好了,因为这样方便和其他人交流注释了的 PDF 文件,也方便在合适的场景下用普通 PDF 阅读器查看高亮和注释。 > > 会有导出,但是应该不会直接保存到pdf里。 我试了一下,导出有高亮和注释,但高亮时不注释的话,它导出的会带有注释,即高亮的这部分内容作为注释。同时还有"PDFTRON"水印
你好,我有3个问题: 1. 你们是否试过ViT划分patch的方法?有的话对比效果如何? 3. 论文的_Figure 4: Visualization of the constructed graph structure._ (b)中显示第1个和第12个block都是14x14个节点,但根据ViG-Ti结构,第1个和第12个block的节点数应是56x56、7x7,对应不上14x14,如何理解? 4. 论文的_Figure 3: Feature diversity of nodes as layer changes._这个图是怎么计算的?需要用到什么数据集来计算吗? 望解答,谢谢!