chatglm.cpp
chatglm.cpp copied to clipboard
多卡推理
一张显卡放不下单个模型的情况下,支持多卡推理吗?