Mewral comments

Results 6 comments of


                                            Mewral

rocketqa在python3.10 paddle-gpu2.5.1 下报错

将paddle-gpu版本改为2.3.2解决

rocketqa在python3.10 paddle-gpu2.5.1 下报错

@Jeffwan Yes, but paddle 2.3.2 has a different structure of fleet like 'paddle.fluid.xxx.fleet' not the same as 2.5.1's 'paddle.fluid.incubate.fleet'

微调GPU需求

@zh-zheng 你好，我在2张V100S上微调10B模型还是会OOM，batch size为1 采用增量微调的方式。有什么办法可以进一步降低显存消耗吗

微调GPU需求

> > @zh-zheng 你好，我在2张V100S上微调10B模型还是会OOM，batch size为1 采用增量微调的方式。有什么办法可以进一步降低显存消耗吗 > > 两张V100 16G吗？两张V100S 32G，因为有其他进程每张卡可用22G左右

我通过CMAKE_ARGS="-DGGML_CUBLAS=ON" pip install chatglm-cpp --force-reinstall -v 安装成功了，但是还是依然不能使用gpu进行推理， docker启动命令加了gpus=all, 加了-e NVIDIA_DRIVER_CAPABILITIES=compute,utility -e NVIDIA_VISIBLE_DEVICES=all 还是不行。请问下是怎么回事呢？@li-plus

13b的模型跑起来，需要多少显存资源

> 可以切分到多张卡部署吗，本地测试了下单张24G的3090部署不了，想尝试下多卡参考deepspeed Zero stage 3

Mewral

rocketqa在python3.10 paddle-gpu2.5.1 下报错

rocketqa在python3.10 paddle-gpu2.5.1 下报错

微调GPU需求

微调GPU需求

使用python接口运行不能调用gpu

13b的模型跑起来，需要多少显存资源