LLaMA-Factory
LLaMA-Factory copied to clipboard
关于单机多卡训练问题
您好,请问如何实现将大模型的参数划分到多张卡上训练,而不是在每张卡上都加载整个模型参数。
同问
用 deepspeed zero3 试试