Qwen2.5
Qwen2.5 copied to clipboard
有没有介绍不同量化模型回答问题的差距分析
我最近想在项目上用qwen1.5来驱动,但是我不太懂int4量化、int8量化还是16量化他们的差距有多大。有没有关于这方面的文章分析