Qwen-VL
Qwen-VL copied to clipboard
<box>这个token是否有特殊含义?
在eval_mm/evaluate_grounding.py
文件中,关于prompt的设置,大致在170行左右, prompt = '<img>{}</img><ref>{}</ref><box>'
只有一个<box>
,能够提示模型进行标框?