BuildingExtraction icon indicating copy to clipboard operation
BuildingExtraction copied to clipboard

DefaultCPUAllocator: not enough memory: you tried to allocate 6291456000 bytes.

Open Linksocarina87 opened this issue 2 years ago • 4 comments

我没对main.py进行任何改动,训练完一个epoch的时候,发生了如题错误。我使用的是32g内存,24g显存3090的电脑进行训练,请问我我该如何修改防止爆内存?

Linksocarina87 avatar May 14 '22 03:05 Linksocarina87

这应该不是显存的问题。尝试一下不使用IDE,只用终端运行;重启电脑,退出其他程序;跑完一个Epoch,在测试的时候,需要保存val集和test集的测试结果到内存中,可能是val集和test集太大,内存装不下,可以试试换更少的val集和test集试试;最后还不行,用conda重新建立个环境试试。

KyanChen avatar May 14 '22 03:05 KyanChen

谢谢你的快速回复,我在改小val数据集后内存不会爆了。 我想再请问一下你是否还记得训练集的大小,我使用了24000张图片做训练集,跑200个epoch需要的时间太久了;我想做到跑相同的iteration尽可能复现你的模型,现在毕设时间紧张

Linksocarina87 avatar May 14 '22 09:05 Linksocarina87

可以适当,将训练集图片分少一些,比如按5:2:3分train,val,test。现在提供了训练好的模型,请看项目主页

KyanChen avatar Jun 29 '22 06:06 KyanChen

数据集确实很大,你可以选择一些小数据集进行实验

| | 陈科研 | | @.*** | 签名由网易邮箱大师定制

On 05/14/2022 @.***> wrote:

谢谢你的快速回复,我在改小val数据集后内存不会爆了。 我想再请问一下你是否还记得训练集的大小,我使用了24000张图片做训练集,跑200个epoch需要的时间太久了;我想做到跑相同的iteration尽可能复现你的模型,现在毕设时间紧张

— Reply to this email directly, view it on GitHub, or unsubscribe. You are receiving this because you commented.Message ID: @.***>

KyanChen avatar Oct 11 '22 08:10 KyanChen