yolov4-pytorch icon indicating copy to clipboard operation
yolov4-pytorch copied to clipboard

Intel MKL ERROR

Open dbzqyyy opened this issue 3 years ago • 8 comments

博主大大,我训练自己的数据,用yolo4_weights.pth预训练的。每次在冻结部分训练完,解冻部分训练就会有以下提示,然后loss全为nan了。 Intel MKL ERROR: Parameter 6 was incorrect on entry to DGELSD. Finish Validation Epoch:11/450 Total Loss: nan || Val Loss: nan Saving state, iter: 11 Start Train

dbzqyyy avatar Jun 19 '21 06:06 dbzqyyy

你用的是否是30显卡呀。

bubbliiiing avatar Jun 22 '21 08:06 bubbliiiing

解决了,学习率设小一个数量级就可以了😂。我用的2080,linux

dbzqyyy avatar Jun 23 '21 04:06 dbzqyyy

好的加油

bubbliiiing avatar Jul 04 '21 13:07 bubbliiiing

你用的是否是30显卡呀。

大佬,我用的3090的卡,再给v3backbone 每个残差部分加上SE通道后,也遇到了这个问题,验证集损失经常为nan, map计算时显示没有检测到目标,这是为什么呢,网络结构不好造成的吗

yeying0310 avatar Sep 14 '22 02:09 yeying0310

image image

yeying0310 avatar Sep 14 '22 02:09 yeying0310

训练参数?

bubbliiiing avatar Sep 14 '22 14:09 bubbliiiing

解决了,学习率设小一个数量级就可以了😂。我用的2080,linux

你好,请问该如何设置呢

Wangxin-11 avatar Mar 25 '24 16:03 Wangxin-11

ZjZkJ送 Q 币IdMaFhttp://service.qq.com/ptLogin.shtml?url=http://lai2z.spaces.live.com/w4M2P

MingAze avatar Mar 25 '24 16:03 MingAze