world2025
Results
113
comments of
world2025
@YueSangShuai @ouxiand 请问两位搞定了数据标注吗
@shibing624 请问下reward model数据集不支持像Instructgpt一样,一个prompt+k个response的排序集合吗?我看数据构造这块仅仅是偏好对的数据
reward model支持中文吗