PIDNet icon indicating copy to clipboard operation
PIDNet copied to clipboard

训练出错

Open piong2333 opened this issue 2 years ago • 17 comments

训练一小会之后就出错停止训练,过程数据如下,请问是什么原因呀 image

piong2333 avatar Feb 03 '23 06:02 piong2333

@piong2333 请问你这个怎么跑起来的,pytorch版本是多少呀,我这总提示CUDA error 1675580328573

JOP-Lee avatar Feb 05 '23 06:02 JOP-Lee

@piong2333 请问你这个怎么跑起来的,pytorch版本是多少呀,我这总提示CUDA error 1675580328573

你有几个gpu呀,我电脑只有一个gpu,改了这几个好像j就跑起来了 image image

piong2333 avatar Feb 05 '23 07:02 piong2333

@piong2333 请问你这个怎么跑起来的,pytorch版本是多少呀,我这总提示CUDA error 1675580328573

你有几个gpu呀,我电脑只有一个gpu,改了这几个好像j就跑起来了 image image

@piong2333 4块,改了还是这个错。我跑的是cityscape那个视频序列的,不知道是不是这个模型预测出来的结果,不能当作GT训练

JOP-Lee avatar Feb 05 '23 07:02 JOP-Lee

Hello,

I am facing the same error. Can someone tell me exactly what to do? I tried to translate the above answer, and also tried model = model.cuda() this did not work for me. The screen shot of my error is as shown below. And, the details about my graphics card are also shown below in image.

Error message

image

Graphics card and CUDA details

image

ShubhamAbhayDeshpande avatar Apr 04 '23 20:04 ShubhamAbhayDeshpande

Hello,

I am facing the same error. Can someone tell me exactly what to do? I tried to translate the above answer, and also tried model = model.cuda() this did not work for me. The screen shot of my error is as shown below. And, the details about my graphics card are also shown below in image.

Error message

image

Graphics card and CUDA details

image

Sorry, I couldn't run this code and ended up giving up. I didn't quite understand the error and couldn't help you solve it. QAQ

piong2333 avatar Apr 05 '23 12:04 piong2333

It is ok. I will open an new issue in english ; ) I will attach the link to the issue here.

Let's see if someone answers.

Link to the issue. https://github.com/XuJiacong/PIDNet/issues/47

ShubhamAbhayDeshpande avatar Apr 05 '23 19:04 ShubhamAbhayDeshpande

@piong2333 and @JOP-Lee is it possible to use this model purely on CPU cores? I think the error above are caused because insufficient space on GPU (especially when we are using a single GPU).

ShubhamAbhayDeshpande avatar Apr 05 '23 21:04 ShubhamAbhayDeshpande

有人遇到这个问题吗,我用cityscapes就能训练完毕,但用自己的数据集就报这个错误 Has anyone encountered this problem? I can train with cityscapes, but this error is reported using my own dataset image

kongbai-account avatar Aug 02 '23 01:08 kongbai-account

有人遇到这个问题吗,我用cityscapes就能训练完毕,但用自己的数据集就报这个错误 Has anyone encountered this problem? I can train with cityscapes, but this error is reported using my own dataset image

请问一下这个问题你解决了吗

Zjm33 avatar Oct 29 '23 12:10 Zjm33

训练一小会之后就出错停止训练,过程数据如下,请问是什么原因呀 图像

你好,请问你的这个问题解决了吗?

Lv595 avatar Nov 19 '23 06:11 Lv595

有人遇到这个问题吗,我用cityscapes就能训练完毕,但用自己的数据集就报这个错误 Has anyone encountered this problem? I can train with cityscapes, but this error is reported using my own dataset image

请问一下这个问题你解决了吗

解决了,issue#65,我的问题原因就是数据集中采用的resize方式有错,resize之后png标签的像素值发生了变化,多了几个像素值

kongbai-account avatar Nov 23 '23 01:11 kongbai-account

训练一小会之后就出错停止训练,过程数据如下,请问是什么原因呀 图像

你好,请问你的这个问题解决了吗?

没有解决,已经没有进行这个方面的研究了QAQ

piong2333 avatar Nov 23 '23 09:11 piong2333

训练一小会之后就出错停止训练,过程数据如下,请问是什么原因呀 图像

你好,请问你的这个问题解决了吗?

没有解决,已经没有进行这个方面的研究了QAQ

谢谢你的回复,我已解决问题。

Lv595 avatar Nov 24 '23 09:11 Lv595

训练一小会之后就出错停止训练,过程数据如下,请问是什么原因呀 图像

你好,请问你的这个问题解决了吗?

没有解决,已经没有进行这个方面的研究了QAQ

谢谢你的回复,我已解决问题。

你好,这个要怎么解决?我也遇到了(哭死)

YUE-GOOD avatar Jan 09 '24 02:01 YUE-GOOD

训练一小会之后就出错停止训练,过程数据如下,请问是什么原因呀图像

你好,请问你的这个问题解决了吗?

没有解决,已经没有进行这个方面的研究了QAQ

谢谢你的回复,我已解决问题。

你好,这个要怎么解决?我也遇到了(哭死)

您好!我也遇到了相同的问题。请问您解决了吗 clipboard-image-1719913128

AAAdecade avatar Jul 02 '24 12:07 AAAdecade

训练一小会之后就出错停止训练,过程数据如下,请问是什么原因呀图像

你好,请问你的这个问题解决了吗?

没有解决,已经没有进行这个方面的研究了QAQ

谢谢你的回复,我已解决问题。

你好,这个要怎么解决?我也遇到了(哭死)

训练一小会之后就出错停止训练,过程数据如下,请问是什么原因呀图像

你好,请问你的这个问题解决了吗?

没有解决,已经没有进行这个方面的研究了QAQ

谢谢你的回复,我已解决问题。

您好,请问是怎么解决的?我也遇到了相同的问题:训练过程似乎在第0个epoch的第240个iteration停止了,并且后面出现了一个类似计数的输出 0/10/20/... clipboard-image-1719913128

AAAdecade avatar Jul 02 '24 12:07 AAAdecade