OpenRLHF
OpenRLHF copied to clipboard
PPO采用zero 3 stage后产生time out error
脚本修改如下,ckpt换为Qwen:
有可能是deepspeed的问题 可以尝试降低一下版本号,比如 v0.13.5 see https://github.com/microsoft/DeepSpeed/issues/5520
脚本修改如下,ckpt换为Qwen:
有可能是deepspeed的问题 可以尝试降低一下版本号,比如 v0.13.5 see https://github.com/microsoft/DeepSpeed/issues/5520