b762927

Results 2 comments of b762927

Can it reach the paper benchmark?

我想请教一下!您的任务也带box,然后我理解InternVL它会动态处理输入图片。您是直接把box缩放到[0,1000]尺度,还是先让box随着动态处理图片(到448的整数倍),然后再把box缩放到[0,1000]