Qwen-VL icon indicating copy to clipboard operation
Qwen-VL copied to clipboard

请问微调方式,可以让Qwen-VL-Chat学会新的图片的解读、位置定位等能力吗?

Open 2132660698 opened this issue 2 years ago • 3 comments

因为有些业务需求的图片,Qwen-VL并不认识或者识别不准,请问微调方式,可以让Qwen-VL-Chat学会新的图片的解读、位置定位等能力吗?

2132660698 avatar Oct 15 '23 12:10 2132660698

在数据量大和训练充分的情况下是可以通过微调方式,可以让Qwen-VL-Chat学会新的图片的解读、位置定位等能力的

ShuaiBai623 avatar Oct 16 '23 03:10 ShuaiBai623

好的,非常感谢您的回复,如果想让图片得到训练,是否将下图中的--fix_vit True改为False? image

还有下图中的微调的层需要修改吗? image

2132660698 avatar Oct 17 '23 00:10 2132660698

看代码,lora的话,这个参数没起作用 if not training_args.use_lora: if training_args.fix_vit and hasattr(model,'transformer') and hasattr(model.transformer,'visual'): model.transformer.visual.requires_grad_(False) if hasattr(model.transformer.visual,'attn_pool'): model.transformer.visual.attn_pool.requires_grad_(True)

paulxu1314 avatar Mar 06 '24 13:03 paulxu1314