Qwen-VL icon indicating copy to clipboard operation
Qwen-VL copied to clipboard

<box>这个token是否有特殊含义?

Open danjuan-77 opened this issue 11 months ago • 1 comments

eval_mm/evaluate_grounding.py文件中,关于prompt的设置,大致在170行左右, prompt = '<img>{}</img><ref>{}</ref><box>' 只有一个<box>,能够提示模型进行标框?

danjuan-77 avatar Feb 29 '24 02:02 danjuan-77

貌似开启了一个填空任务?去掉这个token之后,模型可以输出多个box坐标,但是去掉之前,只能输出一个坐标。

danjuan-77 avatar Feb 29 '24 09:02 danjuan-77