DSFD.pytorch
DSFD.pytorch copied to clipboard
显存小的GPU跑起来很容易梯度爆炸
救救只有4G显存的用户吧。。。batch_size只能设成2,跑起来动不动就梯度爆炸。。。该怎么办
把batchnorm改成groupnorm有用么
我也是
不是显存的问题,我昨天刚跑的,24G显存,batch是16,loss依然会inf
lr调小一些应该会好点