chatglm.cpp
chatglm.cpp copied to clipboard
运行chatglm3-6b-ggml int4量化模型,采用clblast加速反而比cpu加速慢很多,正常吗?
机器配置i7-12700F,3060显卡12GB显存,64GB 内存。
机器配置i7-12700F,3060显卡12GB显存,64GB 内存。
可以先观察下推理的时候到底用的CPU还是GPU