Co-DETR icon indicating copy to clipboard operation
Co-DETR copied to clipboard

关于vit模型的困惑

Open ocrhei opened this issue 1 year ago • 1 comments

请问在不同的数据集中,drop_path_rate和window_size设置了不同的值,它的依据是什么呢,为什么coco数据集的drop_path_rate和window_size比lvis的低呢。

ocrhei avatar Sep 13 '24 02:09 ocrhei

  1. lvis训练的显存消耗很大,以及lvis训练使用不同的augmentation (LSJ)和分辨率,因此选择了较小的window size。
  2. 不同数据集上对应的最佳drop_path_rate设置可能不同。

TempleX98 avatar Sep 20 '24 10:09 TempleX98