STMTrack icon indicating copy to clipboard operation
STMTrack copied to clipboard

out of memory

Open INTOUCHABLE-VS opened this issue 2 years ago • 5 comments

在只改变Batchsize的情况下,当我在一个台 i9-10900k 64GB内存 、3090服务器上使用全数据集训练时,发现内存占用会逐渐上升,并在第13-14个epoch发生内存溢出,这在之前训练时是没有发生过的,而且我除了修改训练配置并未修改任何其他代码,请问是什么原因呢?

INTOUCHABLE-VS avatar Dec 07 '22 14:12 INTOUCHABLE-VS

在只改变Batchsize的情况下,当我在一个台 i9-10900k 64GB内存 、3090服务器上使用全数据集训练时,发现内存占用会逐渐上升,并在第13-14个epoch发生内存溢出,这在之前训练时是没有发生过的,而且我除了修改训练配置并未修改任何其他代码,请问是什么原因呢?

是内存溢出还是显存溢出?训练配置除了batch_size外,还有修改其他内容吗?

fzh0917 avatar Dec 07 '22 14:12 fzh0917

在只改变Batchsize的情况下,当我在一个台 i9-10900k 64GB内存 、3090服务器上使用全数据集训练时,发现内存占用会逐渐上升,并在第13-14个epoch发生内存溢出,这在之前训练时是没有发生过的,而且我除了修改训练配置并未修改任何其他代码,请问是什么原因呢?

是内存溢出还是显存溢出?训练配置除了batch_size外,还有修改其他内容吗?

除了将batchsize 20,num workers 16外,还将sync bn置为false

INTOUCHABLE-VS avatar Dec 08 '22 03:12 INTOUCHABLE-VS

如果是内存溢出的话,可以尝试把DataLoader的pin_memory参数设置为False。

fzh0917 avatar Dec 09 '22 15:12 fzh0917

谢谢您的回复,我先尝试一下

INTOUCHABLE-VS avatar Dec 09 '22 15:12 INTOUCHABLE-VS

如果是内存溢出的话,可以尝试把DataLoader的pin_memory参数设置为False。

您好,将pin_memory设置为False之后,内存还是逐渐占满并溢出。请问除了参数设置,还有可能是其他因素影响吗,比如数据集图片、训练环境之类的。

INTOUCHABLE-VS avatar Dec 11 '22 02:12 INTOUCHABLE-VS