LightCompress issues

Why quarot algo R2 rotate needed online_rotate?

2

Based on the original quarot method, the R2 rotate can be observed by weight, no need for online rotate. https://github.com/ModelTC/llmc/blob/867fb4f536073a2898048c39aa098979521a45a6/llmc/compression/quantization/quarot.py#L139

54limiao

bug on awq v2

1，现状：目前使用deepseek-r1进行awq量化，采用clip_version: v2报错 2，awq_w_only.yml参数如下： base: seed: &seed 42 model: type: DeepseekV3 path: /mnt/DeepSeek-R1 tokenizer_mode: slow torch_dtype: auto calib: name: pileval download: False path: /home/llmc/data/pileval n_samples: 128 bs: -1 seq_len: 512 preproc:...

ChenBinfighting1

djm012

get_float_qparams 忽略量化粒度？

2

get_float_qparams里求出来的tensor和scales形状永远一样，量化粒度：per-tensor/group/channel失效了？

guanchenl

LightCompress
LightCompress copied to clipboard

Metadata

Why quarot algo R2 rotate needed online_rotate?

bug on awq v2

How to extract input tensors for GEMM after pruning and quantization?

Can llmc support Whisper model quantization?

support gemma3 quantization

关于导出vllm的问题

get_float_qparams 忽略量化粒度？

← Metadata

Owner

Metadata

LightCompress LightCompress copied to clipboard

Metadata

Why quarot algo R2 rotate needed online_rotate?

bug on awq v2

How to extract input tensors for GEMM after pruning and quantization?

Can llmc support Whisper model quantization?

support gemma3 quantization

关于导出vllm的问题

get_float_qparams 忽略量化粒度？

← Metadata

Owner

Metadata

LightCompress
LightCompress copied to clipboard