GLM-4 icon indicating copy to clipboard operation
GLM-4 copied to clipboard

请教一下,glm-4v会支持vllm推理吗?

Open Jimmy-L99 opened this issue 1 year ago • 2 comments
trafficstars

Feature request / 功能建议

glm-4v使用vllm推理。

Motivation / 动机

目前想尝试服务器部署,使用多客户端对glm4v的api server发起请求,但是用Transformers推理返回结果太慢。看到glm4-chat用vllm推理的速度快了不少,因此希望4v也能支持vllm推理。

Your contribution / 您的贡献

Jimmy-L99 avatar Oct 12 '24 02:10 Jimmy-L99

同问,sss

elesun2018 avatar Oct 12 '24 08:10 elesun2018

在最近的PR中已经将GLM-4v适配了vllm=0.6.2,相信很快就会合并。您可以部署最新版的vllm,并且参考PR 585readme中的示例进行推理

sixsixcoder avatar Oct 14 '24 01:10 sixsixcoder

@sixsixcoder 想问下支持使用glm 4v 9b int4进行推理嘛?

neblen avatar Oct 16 '24 07:10 neblen

@sixsixcoder 想问下支持使用glm 4v 9b int4进行推理嘛?

暂不支持

sixsixcoder avatar Oct 16 '24 08:10 sixsixcoder