Image-Adaptive-YOLO icon indicating copy to clipboard operation
Image-Adaptive-YOLO copied to clipboard

用gpu训练train loss为nan

Open WWJ0720 opened this issue 2 years ago • 18 comments

大家有遇到过用gpu训练train loss为nan的情况吗,尝试了很多办法无法解决

WWJ0720 avatar Mar 23 '23 03:03 WWJ0720

你好,请问你跑通了吗,我在跑voc数据集上遇到了一些困难,能不能和你取得联系

XwX123321 avatar Mar 24 '23 08:03 XwX123321

你好,请问你跑通了吗,我在跑voc数据集上遇到了一些困难,能不能和你取得联系

我还没跑通,qq:1920698385

WWJ0720 avatar Mar 24 '23 08:03 WWJ0720

怎么说兄弟,你弄出来了吗

andwizard avatar Apr 14 '23 03:04 andwizard

你好,请问您解决了吗,我找了很多办法,用GPU还是nan,希望可以得到您的帮助,谢谢

LittleShuo avatar Apr 15 '23 08:04 LittleShuo

你好,请问您解决了吗,我找了很多办法,用GPU还是nan,希望可以得到您的帮助,谢谢

@LittleShuo 你好,我也遇到一樣的問題, 請問你解决了嗎?

SingCheng avatar May 15 '23 08:05 SingCheng

你們都是用rtx30的顯卡嗎?

SingCheng avatar Jun 12 '23 04:06 SingCheng

你們都是用rtx30的顯卡嗎?

我GTX 1080兄弟

andwizard avatar Jun 12 '23 13:06 andwizard

@SingCheng 没有解决

LittleShuo avatar Jun 12 '23 14:06 LittleShuo

如果你用的是RTX30/40顯卡,你們可以用下面的解决

  1. conda create -n myenv python=3.8
  2. pip install nvidia-pyindex
  3. pip install nvidia-tensorflow
  4. conda install tensorboard

我個人理解是tensorflow官方不會更新1.x的版本了,你只要用nvidia的版本(包括了CPU跟GPU)就不會有問題了.

SingCheng avatar Jun 12 '23 14:06 SingCheng

@SingCheng 我用的30的卡,如果只使用cpu不用gpu的话就正常,使用gpu就为nan,这种方案也试过了,还是同样问题。

LittleShuo avatar Jun 12 '23 14:06 LittleShuo

@SingCheng 嗯,好的我再试试,谢谢

LittleShuo avatar Jun 12 '23 14:06 LittleShuo

@SingCheng 嗯,好的我再试试,谢谢

你是在什麼平台下跑的?Linux?

SingCheng avatar Jun 12 '23 14:06 SingCheng

@SingCheng Linux

LittleShuo avatar Jun 12 '23 14:06 LittleShuo

@SingCheng Linux

python 版本是?

SingCheng avatar Jun 12 '23 14:06 SingCheng

@SingCheng Linux

Ubuntu 20.04 or later (64-bit) GPU support requires a CUDA®-enabled card For NVIDIA GPUs, the r455 driver must be installed For wheel installation:

Python 3.8 pip 20.3 or later

這個是package的要求,你看看有沒有符合要求

SingCheng avatar Jun 12 '23 14:06 SingCheng

@SingCheng 为了适配Tensor1.x所以用了python3.7

LittleShuo avatar Jun 12 '23 14:06 LittleShuo

@SingCheng 为了适配Tensor1.x所以用了python3.7

你把python升級到3.8就可以了

SingCheng avatar Jun 12 '23 14:06 SingCheng

好的,我试试,非常感谢

LittleShuo avatar Jun 12 '23 14:06 LittleShuo