InternVL icon indicating copy to clipboard operation
InternVL copied to clipboard

全量微调vl-3.5-1B后,使用vllm推理报错:ValueError: pixel_values dim[2] expected 448, got 384

Open YiJunSachs opened this issue 3 months ago • 2 comments

但是我lora去调1b,然后再去推理并没有报这个错啊

YiJunSachs avatar Sep 20 '25 07:09 YiJunSachs

建议检查一下图像预处理的时候是不是把每个patch resize成384x384了,正常应该是448x448

Weiyun1025 avatar Sep 22 '25 01:09 Weiyun1025

建议检查一下图像预处理的时候是不是把每个patch resize成384x384了,正常应该是448x448

video_preprocessor_config.json中的高度和宽度是384*384,所以报错了

YiJunSachs avatar Sep 29 '25 11:09 YiJunSachs