RainNet icon indicating copy to clipboard operation
RainNet copied to clipboard

关于训练时使用gpu

Open ymj98 opened this issue 2 years ago • 5 comments

您好,我在您的训练代码里没有找到关于规定gpu使用编号的相关代码,但您在train.sh里使用了一个相关参数,请问这个gpu nums的参数是可以使用多卡训练的嘛?您在训练中的相关代码又是在哪个文件里呢?期待您的回复

ymj98 avatar Nov 02 '21 10:11 ymj98

您好,我的代码可以对任意标号的单GPU进行训练,标号0,1,2,3均可,但是我但是忘了写针对多GPU并行训练的代码了,sorry。我训练的时候也是单卡训练的,不同的卡跑不同的setting。您要是有需要的话,可以尝试使用torch的distributed training

junleen avatar Nov 02 '21 10:11 junleen

您是在哪个代码将模型还有数据迁移到cuda上的呢?我暂时没找到

ymj98 avatar Nov 02 '21 10:11 ymj98

这里定义网络,到这里定义G,跳转到这里

junleen avatar Nov 02 '21 11:11 junleen

这里定义网络,到这里定义G,跳转到这里

谢谢您,还有一个问题就是,我在train.py里未发现您引入class rainnet,您在train.py里是如何实例化这个网络的呢,我只找到一行create_model,但我一路索引并未找到实例化rainnet的代码,麻烦您了

ymj98 avatar Nov 02 '21 11:11 ymj98

这里根据opt.model=rainnet找到了rainnet_model.py这个模块,然后导入了RainNet模型。这个地方我没有在原DoveNet的代码上改好,抱歉哈

junleen avatar Nov 04 '21 13:11 junleen