verl icon indicating copy to clipboard operation
verl copied to clipboard

No image input question

Open OliverLeeXZ opened this issue 1 month ago • 3 comments

您好,使用grpo训练qwen3-VL-8B-Instruct模型的时候,遇到VL模型看不见图片的问题,具体表现为在每一步模型Rollout的输出no image provided请问这是什么原因?rollout的engine是sglang.

OliverLeeXZ avatar Nov 24 '25 04:11 OliverLeeXZ

补充:在Qwen2.5VL上面正常,感觉这有可能是Qwen3-VL的image.processor的问题?它处理image后为空,导致它走了text only的分支

OliverLeeXZ avatar Nov 24 '25 08:11 OliverLeeXZ

补充:使用vllm+megatron运行成功,但是sglang+fsdp仍然报错

Image

OliverLeeXZ avatar Nov 25 '25 05:11 OliverLeeXZ

请问vllm+fsdp您有试过么

SupreCyk avatar Nov 27 '25 07:11 SupreCyk

升级sglang版本可以解决

cjfcsjt avatar Dec 18 '25 09:12 cjfcsjt

升级sglang版本可以解决

我草了,大哥你是我的救命恩人。刚刚因为同样毛病白忙活一整天,重新来搜这个问题发现了几个小时前的回答。成功解决了(早知道先摸鱼一整天然后就可以直接来看到正确答案了……)

FlyTweety avatar Dec 18 '25 19:12 FlyTweety