MOSS-RLHF
MOSS-RLHF copied to clipboard
reward_model准确率
想请教下开源的中英文reward_model的准确率大概是多少呢?
您好,详见技术报告第十页,有中英文reward model在trainset 和 evalset上面的准确率