world2025

Results 113 comments of world2025

@YueSangShuai @ouxiand 请问两位搞定了数据标注吗

@shibing624 请问下reward model数据集不支持像Instructgpt一样,一个prompt+k个response的排序集合吗?我看数据构造这块仅仅是偏好对的数据

reward model支持中文吗