lmdeploy
lmdeploy copied to clipboard
[Docs] 支持量化压缩Intern-S1 和InternVL3_5-241B-A28B 吗?
📚 The doc issue
如何量化压缩Intern-S1 和InternVL3_5-241B-A28B ?
Suggest a potential alternative/fix
No response
同问,支持s1-mini么
InterVL3.5 fp8 量化可以尝试一下这个
https://github.com/InternLM/lmdeploy/pull/4018
其余量化方式目前可能存在适配问题,这边没有明确验证过能否成功