王小奇
王小奇
好的!期待。。。
谢谢你的回复,我想再确认一下:论文表3(a)中,作者使用一些预训练模型例如CLIP,直接测试数据集中所有样本关于图文对齐的性能,没有finetuning?如果是这样,我测试出来的结果和表3(a)的差距很大,例如ImageReward 的SRCC只有0.4765,而作者的是0.7298. 在图文对齐测试中,论文并未对数据划分方式进行说明。
When running the command: python demo/image_demo.py \ demo/demo.jpg \ projects/CO-DETR/configs/codino/coo_dino_5scale_swin_l_lsj_16xb1_3x_coco.py \ --weights pre-trained/co_dino_5scale_lsj_swin_large_1x_coco-3af73af2.pth Modify the image_demo.py file to append the chunked size to the test_cfg dictionary as follows: inferencer.model.test_cfg.append({'chunked_size': chunked_size})...