Qwen2.5
Qwen2.5 copied to clipboard
Qwen1.5-7B-Chat-GPTQ-Int4模型加载报错
我在用快速使用的例子,加载Qwen1.5-7B-Chat-GPTQ-Int4模型时,会报
Traceback (most recent call last):
File "test_qwen_1.5.py", line 4, in
但是加载Qwen1.5-7B-Chat-GPTQ-Int8模型是好的,可以正常推理,请问这是什么原因呢?