GLM-4 icon indicating copy to clipboard operation
GLM-4 copied to clipboard

openai api部署glm-4-9b-chat如何设置多gpu

Open desertfoxfj opened this issue 5 months ago • 1 comments

System Info / 系統信息

ubuntu18.04

Who can help? / 谁可以帮助到您?

No response

Information / 问题信息

  • [ ] The official example scripts / 官方的示例脚本
  • [ ] My own modified scripts / 我自己修改的脚本和任务

Reproduction / 复现过程

我是两张 3060(一张 12G 显存)通过 openai_api 代码部署 glm-4-9b-chat,一直报显存不足,也没有招待代码中设置多 GPU 的地方 glm-4/basic_demo/openai_api_server.py

Expected behavior / 期待表现

这种场景应该如何配置多GPU

desertfoxfj avatar Sep 03 '24 08:09 desertfoxfj