eval-scope
eval-scope copied to clipboard
health bench数据集测评错误
自查清单
在提交 issue 之前,请确保您已完成以下步骤:
问题描述
请简要描述您遇到的问题。 health bench数据集第一个子集跑完 后review报错
测评命令:
EvalScope 版本(必填)
v1.2.0
使用的工具
- [ ] Native / 原生框架
- [ ] Opencompass backend
- [ ] VLMEvalKit backend
- [ ] RAGEval backend
- [ ] Perf / 模型推理压测工具
- [ ] Arena / 竞技场模式
执行的代码或指令
请提供您执行的主要代码或指令。
错误日志
请粘贴完整的错误日志或控制台输出。
运行环境
- 操作系统:
- Python版本:
其他信息
如果有其他相关信息,请在此处提供。