Lee JI Eun
Results
1
issues of
Lee JI Eun
作者您好,我在使用DINO_train_submitit.sh脚本训练的时候,我sh里定义--ngpus 2 或者--ngpus 4,我的电脑里有4个gpu,并且我print了一些信息,看见分配的时候也是每个进程各分配一张gpu,但训练起来的时候就出现多个进程同时占用同一个gpu显存的问题,导致前几个进程直接崩溃,只留下最后一个进程在那里训练。我想问一下这个问题怎么解决呢,谢谢!