PaddleX icon indicating copy to clipboard operation
PaddleX copied to clipboard

paddlex多卡训练

Open gitmhg opened this issue 2 years ago • 1 comments

Checklist:

  1. 查找历史相关issue寻求解答
  2. 翻阅FAQ常见问题汇总和答疑
  3. 确认bug是否在新版本里还未修复
  4. 翻阅PaddleX 使用文档

描述问题

复现

  1. 您是否已经正常运行我们提供的教程? 是的
  2. 您是否在教程的基础上修改代码内容?还请您提供运行的代码 没有
  3. 您使用的数据集是? 目标检测样例
  4. 请提供您出现的报错信息及相关log 我已经成功安装paddlex和nccl(并通过测试nccl-test) paddlex单卡可以正常训练,但是如果多卡训练 image

通过nvidia-smi查看显卡发现只有一个显卡再用

环境

  1. 请提供您使用的PaddlePaddle和PaddleX的版本号 paddlepaddle-gpu 2.3.1.post116 paddleslim 2.2.1 paddlex 2.1.0
  2. 请提供您使用的操作系统信息,如Linux/Windows/MacOS linux ubuntu
  3. 请问您使用的Python版本是? python 3.8
  4. 请问您使用的CUDA/cuDNN的版本号是? cuda 11.6 cudnn 8.4

gitmhg avatar Feb 08 '23 10:02 gitmhg

nvidia-smi结果看看0和1对应的卡号是多少

lailuboy avatar Feb 24 '23 03:02 lailuboy