VLMEvalKit icon indicating copy to clipboard operation
VLMEvalKit copied to clipboard

VLMblind测试精度,请问可以share下这个测试集的精度么;我自己跑出来和seed-1.5-vl报告中精度相差比较大

Open CuritisSun opened this issue 6 months ago • 1 comments

报告qwen-72b中精度为69,自己跑出来是60

CuritisSun avatar Jun 24 '25 01:06 CuritisSun

我们测试精度在 61% 左右,确实低于 SEED 技术报告中所报告结果。

kennymckormick avatar Jun 27 '25 07:06 kennymckormick