zzhaowendao
Results
1
issues of
zzhaowendao
### Motivation 对于很大的模型如ds六百多B,单卡显存不够用。 目前lite命令只支持单卡,希望后续能够增加支持单机多卡。 具体如下: 1. lite auto_awq命令支持单机多卡 2. lite smooth_quant命令支持单机多卡 3. lite smooth_quant命令支持ascend环境 另外推理这块后端为pytorch时也存在不支持的情况,希望后续能够增加支持: 1. 使用auto_awq w4a16量化模型成功,推理后端为pytorch即--backend pytorch情况下,对单机多卡的支持。 具体测试结论见下面内容。 ### Related resources _No response_ ### Additional context 测试了多种不同的用例,总结如下: 推理命令大致这样:lmdeploy...