Rex_Xing
Rex_Xing
> 行地方错了,需要在根目录下进行微调运行 sh 文件 你好我也遇到了同样的情况,请问在根目录下微调你具体指的是什么呢,十分感谢!
> @MrRexy-Ling , 就是把微调训练的指令放到 shell脚本里,用bash来启动 run.py, 因为需要开启多个进程,所以一般用 .sh文件来执行模型的训练启动,截图上面就是我的 run.sh的内容, 多谢,问题解决了
> > > @MrRexy-Ling , 就是把微调训练的指令放到 shell脚本里,用bash来启动 run.py, 因为需要开启多个进程,所以一般用 .sh文件来执行模型的训练启动,截图上面就是我的 run.sh的内容, > > > > > > 多谢,问题解决了 > > 你好,我现在复现一个程序,原程序用bash启动,原来的程序用8个GPU,我用一个,好像也出现了这个问题 你好,你最后.sh 文件里指定GPU个数了吗,通常情况下八卡的DDP用单卡是可以运行的,就是world rank一直默认为0,你可以检查一下一下程序里分布式训练的部分