iTPN
iTPN copied to clipboard
Great work~ Some issues and quetions
很棒的工作,恭喜! 有几个问题想请教一下:
- 在进行itpn_clip中的预训练时,即执行以下指令时,--blr与--beta参数似乎并不存在;此外,在engine_for_pretraining.py的第62行中,计算loss_1 = loss_fn(input=outputs[0], target=labels)时,有报错"RuntimeError: The size of tensor a (512) must match the size of tensor b (768) at non-singleton dimension 2"
python -m torch.distributed.launch --nproc_per_node=8 --nnodes 8 --node_rank=$NODE_RANK \ --master_addr=$MASTER_ADDR --master_port=6666 run_itpn_pretraining.py \ --world_size 8 \ --batch_size 32 \ --model clip_tpn_base_3324_patch16_224 \ --beta 0.98 \ --blr 1.5e-3 \ --clip_path ../ViT-B-16.pt \ --drop_path 0.1 \ --epochs 300 \ --input_size 224 \ --layer_scale_init_value 0.1 \ --opt_eps 1e-8 \ --second_input_size 224 \ - 请问fast itpn与itpn_clip的预训练过程是否有区别呢?是否有开源fast itpn预训练代码的计划呢?
Thanks for your attention. 1. 我们将很快检查一下; 2. fast_itpn使用了更好的监督信号(CLIP-L), 更长的训练步数(1600e),以及更好的技术细节(subln, swiglu等)。我们将尽快开源训练代码。感谢!
感谢回复,期待!