b762927
Results
2
comments of
b762927
Can it reach the paper benchmark?
我想请教一下!您的任务也带box,然后我理解InternVL它会动态处理输入图片。您是直接把box缩放到[0,1000]尺度,还是先让box随着动态处理图片(到448的整数倍),然后再把box缩放到[0,1000]