我正在使用官方支持的任务/模型/数据集进行评估。
python run.py --models hf_llama3_8b --datasets ARC_c_ppl
无
llama3 8b的基座模型,在ARC-C GEN数据集上表现正常。不知道为啥