lindong

Results 2 comments of lindong

对qwen1.5 4b进行autoawqint 4 量化,使用vllm发现比fp16推理速度还慢,什么原因?