Baichuan-7B icon indicating copy to clipboard operation
Baichuan-7B copied to clipboard

[Question] 关于模型在agi-eval上的评测细节

Open yangkexin opened this issue 2 years ago • 1 comments

Required prerequisites

Questions

1.请问一下是用agi-eval的官方脚本评测的吗,我看到官方是提供了每个任务的各五条样例用作few-shot测试,这里测试时候是没有使用这个吗(我看到写的是随机划分,是怎么操作的)? 2.还有只关注四选一意思是:虽然有些是单项选择题但是超过四个选项了(比如其中有ABCDEF)的也过滤了吗?

Checklist

  • [X] I have provided all relevant and necessary information above.
  • [X] I have chosen a suitable title for this issue.

yangkexin avatar Jul 04 '23 06:07 yangkexin

还有一个问题是,过滤后的总评测条数是多少?能开源一下这个子集吗

yangkexin avatar Jul 04 '23 06:07 yangkexin