iTPN icon indicating copy to clipboard operation
iTPN copied to clipboard

Great work~ Some issues and quetions

Open chenxin-dlut opened this issue 1 year ago • 2 comments

很棒的工作,恭喜! 有几个问题想请教一下:

  1. 在进行itpn_clip中的预训练时,即执行以下指令时,--blr与--beta参数似乎并不存在;此外,在engine_for_pretraining.py的第62行中,计算loss_1 = loss_fn(input=outputs[0], target=labels)时,有报错"RuntimeError: The size of tensor a (512) must match the size of tensor b (768) at non-singleton dimension 2" python -m torch.distributed.launch --nproc_per_node=8 --nnodes 8 --node_rank=$NODE_RANK \ --master_addr=$MASTER_ADDR --master_port=6666 run_itpn_pretraining.py \ --world_size 8 \ --batch_size 32 \ --model clip_tpn_base_3324_patch16_224 \ --beta 0.98 \ --blr 1.5e-3 \ --clip_path ../ViT-B-16.pt \ --drop_path 0.1 \ --epochs 300 \ --input_size 224 \ --layer_scale_init_value 0.1 \ --opt_eps 1e-8 \ --second_input_size 224 \
  2. 请问fast itpn与itpn_clip的预训练过程是否有区别呢?是否有开源fast itpn预训练代码的计划呢?

chenxin-dlut avatar Apr 22 '24 13:04 chenxin-dlut

Thanks for your attention. 1. 我们将很快检查一下; 2. fast_itpn使用了更好的监督信号(CLIP-L), 更长的训练步数(1600e),以及更好的技术细节(subln, swiglu等)。我们将尽快开源训练代码。感谢!

sunsmarterjie avatar Apr 24 '24 02:04 sunsmarterjie

感谢回复,期待!

chenxin-dlut avatar Apr 24 '24 02:04 chenxin-dlut