Alan
Results
2
comments of
Alan
> 100b+ 推荐 Megatron. 70b 可以 openrlhf 70b 模型,如果generate_max_len太大的话,32k这种吗,openrlhf是不是也不大支持?
我也想问 现在代码的基础上 想支持deepspeed的 pp的话,修改量大吗