MuKEA icon indicating copy to clipboard operation
MuKEA copied to clipboard

下游任务okvqa、krvqa的batch_size、学习率分别是多少?

Open linxi1158 opened this issue 1 year ago • 8 comments

按照batch_size=256、学习率=1e-4无法复现两个下游任务精度?请问如何设置相关参数以及如何训练?

linxi1158 avatar Jan 22 '24 02:01 linxi1158

image 请问您在Pre-training on VQAv2这一步设置的dataset是vqav2嘛,这里的代码有没有改呢,我找不到data/vqa_img_feature_test.pickle这个文件,请问您在哪找的?

xzr912 avatar Jan 22 '24 10:01 xzr912

自己转的

linxi1158 avatar Jan 22 '24 10:01 linxi1158

自己转的

这个怎么转的,可以参考一下吗,就是生成了这个文件vqa_img_feature_test.pickle吗

xzr912 avatar Jan 22 '24 11:01 xzr912

自己转的

这个怎么转的,可以参考一下吗,就是生成了这个文件vqa_img_feature_test.pickle吗

image

linxi1158 avatar Jan 23 '24 03:01 linxi1158

自己转的

这个怎么转的,可以参考一下吗,就是生成了这个文件vqa_img_feature_test.pickle吗

image

好的,谢谢大佬

xzr912 avatar Jan 23 '24 03:01 xzr912

按照batch_size=256、学习率=1e-4无法复现两个下游任务精度?请问如何设置相关参数以及如何训练? image image

请问在微调阶段,您有过这个报错吗,则会个该如何修改

xzr912 avatar Jan 24 '24 06:01 xzr912

按照batch_size=256、学习率=1e-4无法复现两个下游任务精度?请问如何设置相关参数以及如何训练? image image

请问在微调阶段,您有过这个报错吗,则会个该如何修改

没有,args.load_pthpath这个变量中路径有问题

linxi1158 avatar Jan 24 '24 14:01 linxi1158

按照batch_size=256、学习率=1e-4无法复现两个下游任务精度?请问如何设置相关参数以及如何训练? image image

请问在微调阶段,您有过这个报错吗,则会个该如何修改

没有,args.load_pthpath这个变量中路径有问题

好哒,谢谢大佬

xzr912 avatar Jan 25 '24 13:01 xzr912