VLMEvalKit
VLMEvalKit copied to clipboard
InternVL2.5模型在USE_COT测试时精度均下降了?
InternVL2.5模型在USE_COT测试时精度均下降了? 请问除了Use_COT=“1”之外,还有哪些需要修改吗?
您好,在哪个bench上精度下降了呢
我测试MMMU时,精度下降,请问是测评的时候需要调整代码的哪些地方吗? CUDA_VISIBLE_DEVICES=0,1,2 python run.py --model InternVL2_5-38B --data MMMU_DEV_VAL --verbose CUDA_VISIBLE_DEVICES=0,1,2 USE_COT="1" python run.py --model InternVL2_5-38B --data MMMU_DEV_VAL --verbose