MOSS-RLHF icon indicating copy to clipboard operation
MOSS-RLHF copied to clipboard

用于PPO训练的数据结构

Open Arain-sh opened this issue 1 year ago • 1 comments

这里用于PPO训练的数据结构是什么样的,需要怎么准备

Arain-sh avatar Jul 13 '23 12:07 Arain-sh

您好,我们readme还没更新,会在模型放出后更新(约1天)

Ablustrund avatar Jul 13 '23 15:07 Ablustrund

我们已经公布数据结构格式样例

Ablustrund avatar Jul 14 '23 10:07 Ablustrund