CogVLM2 icon indicating copy to clipboard operation
CogVLM2 copied to clipboard

cuda版本

Open samaritan1998 opened this issue 1 year ago • 6 comments

请问cuda11.8支持么? 安装requirements.txt之后会报错 image

samaritan1998 avatar May 23 '24 08:05 samaritan1998

同问,尝试装了torch2.3.0+cu118,跑cli_demo_multi_gpus.py,报错Runtime error: GET was unable to find an engine to execute

Apricot1225 avatar May 23 '24 09:05 Apricot1225

torch2.3.0+cu121尝试一下

zRzRzRzRzRzRzR avatar May 23 '24 10:05 zRzRzRzRzRzRzR

还是不行,能不能提供一个镜像呢

samaritan1998 avatar May 23 '24 12:05 samaritan1998

那估计是你的硬件安装有问题了,我现在也是在这个环境下运行,目前没有办法提供镜像,不过可以在autodl或者其他这种网站租个pytorch镜像的A100验证一下,我们验证过是能跑通的

zRzRzRzRzRzRzR avatar May 23 '24 13:05 zRzRzRzRzRzRzR

同问,多种方式都尝试都显示 RuntimeError: Triton Error [CUDA]: device kernel image is invalid 方法一、cogvlm本事可以正常跑的环境(torch2.3.0+cuda11.8),运行cogvlm2显示Triton报错 方法二、从零开始conda安装

qinzhenyi1314 avatar May 27 '24 06:05 qinzhenyi1314

torch2.3.0+cu121尝试一下

服务器限制,不能升级驱动,不能使用cu121,之前cogvlm使用cuda11.8是可以的,新的cogvlm2 ,同样的环境 RuntimeError: Triton Error [CUDA]: device kernel image is invalid

qinzhenyi1314 avatar May 27 '24 07:05 qinzhenyi1314

https://github.com/pytorch/pytorch/issues/119054

驱动太老的问题,确保你的硬件的驱动,triron,cuda版本能升到最新的版本

zRzRzRzRzRzRzR avatar May 29 '24 06:05 zRzRzRzRzRzRzR