CasRelPyTorch icon indicating copy to clipboard operation
CasRelPyTorch copied to clipboard

为什么训练时候显示显存才占了5个G,官方的占30个g

Open 18438602970 opened this issue 3 years ago • 0 comments

为什么训练时候显示显存才占了5个G,官方的占30个g,而且还训练的很慢,这是怎么回事啊,标签按理说应该占据很大内存呀,seqlen*关系种类;然后我更改了batch,又说GPU暴了,这是啥情况

18438602970 avatar Jan 15 '22 09:01 18438602970