opencompass
opencompass copied to clipboard

Published 20 hours ago •

Reame
Issues

[Bug] llama3 8b 基座模型在ARC-C PPL数据集上的评估，accuracy只有41，不正常

Open linboyang opened this issue 8 months ago • 0 comments

先决条件

[X] 我已经搜索过问题和讨论但未得到预期的帮助。
[X] 错误在最新版本中尚未被修复。

问题类型

我正在使用官方支持的任务/模型/数据集进行评估。

环境

python run.py --models hf_llama3_8b --datasets ARC_c_ppl

重现问题 - 代码/配置示例

无

重现问题 - 命令或脚本

无

重现问题 - 错误信息

无

其他信息

llama3 8b的基座模型，在ARC-C GEN数据集上表现正常。不知道为啥

Jun 18 '24 14:06 linboyang