yolov4-pytorch icon indicating copy to clipboard operation
yolov4-pytorch copied to clipboard

训练显存不足问题

Open ArthurKeland opened this issue 3 years ago • 6 comments

大佬我想问一下,我的是RTX2060 6G显存,图片大小416x416,解冻阶段batchsize=2,训练到第51个epoch仍然会报显存不足的错,这个是为什么呀?而且还想问一下大佬训练的环境用的是多少显存的呀?

ArthurKeland avatar Dec 13 '21 08:12 ArthurKeland

应该是因为环境配置的问题。2应该可以的

bubbliiiing avatar Dec 15 '21 15:12 bubbliiiing

好嘞好嘞了解了,谢谢

ArthurKeland avatar Dec 16 '21 04:12 ArthurKeland

我也遇到了同样的问题,我的是GTX1650 4G显存,图片大小416x416,解冻阶段batchsize=4,同样训练到第51个epoch仍然会报显存不足的错,如下:

RuntimeError: CUDA out of memory. Tried to allocate 44.00 MiB (GPU 0; 4.00 GiB total capacity; 2.53 GiB already allocated; 4.45 MiB free; 2.68 GiB reserved in total by PyTorch)

@ArthurKeland 请问您解决了吗? @bubbliiiing 我是否还需要降低batchsize?

jhchee18 avatar Oct 04 '22 15:10 jhchee18

再小点吧

bubbliiiing avatar Oct 07 '22 12:10 bubbliiiing

大佬我想问一下,我的是RTX2060 6G显存,图片大小416x416,解冻阶段batchsize=2,训练到第51个epoch仍然会报显存不足的错,这个是为什么呀?而且还想问一下大佬训练的环境用的是多少显存的呀?

请问你后来怎么解决的啊?我遇到了和你一样的问题,谢谢!

ShitaoChen avatar Feb 16 '23 03:02 ShitaoChen

大佬我想问一下,我的是RTX2060 6G显存,图片大小416x416,解冻阶段batchsize=2,训练到第51个epoch仍然会报显存不足的错,这个是为什么呀?而且还想问一下大佬训练的环境用的是多少显存的呀?

请问你后来怎么解决的啊?我遇到了和你一样的问题,谢谢!

我最后租了个Tesla V100 的GPU😂,后来也跑了蛮久的

ArthurKeland avatar Feb 21 '23 09:02 ArthurKeland