Jingsong Yan

Results 2 issues of Jingsong Yan

您好,请问如何实现将大模型的参数划分到多张卡上训练,而不是在每张卡上都加载整个模型参数。

pending

论文的第三页最后一段和第四页第一段内容重复。