Paddle icon indicating copy to clipboard operation
Paddle copied to clipboard

kube上使用paddle框架只能识别第一个gpu

Open wumuyu9 opened this issue 3 months ago • 1 comments

bug描述 Describe the Bug

使用kube,docker容器,设置不指定gpu(可以分配所有gpu,这样可设置gpu的id),安装paddle2.6或者3.2,结果只能显示和使用第一个gpu,nvidia-smi可以显示所有gpu,pytorch也可以显示使用多个gpu。

其他补充信息 Additional Supplementary Information

No response

wumuyu9 avatar Dec 09 '25 02:12 wumuyu9

Image

wumuyu9 avatar Dec 09 '25 02:12 wumuyu9

不用设置CUDA_VISIBLE_DEVICES 和 CUDA_DEVICE_ORDER paddle就可以只用全部GPU,你可以再试试

danleifeng avatar Dec 12 '25 03:12 danleifeng

直接运行 paddle.utils.run_check() 也可以检测,可以试试

danleifeng avatar Dec 12 '25 03:12 danleifeng