lindong
Results
2
comments of
lindong
对qwen1.5 4b进行autoawqint 4 量化,使用vllm发现比fp16推理速度还慢,什么原因?