ChatGLM2-6B [BUG/Help] int8的版本哪儿下载

[BUG/Help] int8的版本哪儿下载

Open likunpm opened this issue 1 year ago • 5 comments

RT 求int8版本

No response

RT 求int8版本

- OS:
- Python:
- Transformers:
- PyTorch:
- CUDA Support (`python -c "import torch; print(torch.cuda.is_available())"`) :

No response

Jun 27 '23 16:06 likunpm

文档上有

model = AutoModel.from_pretrained("THUDM/chatglm2-6b", trust_remote_code=True).quantize(8).cuda()

Jun 28 '23 07:06 BrightXiaoHan

哪如果修改称quantize(4)，是不是就等同于int4的模型库

Jun 29 '23 06:06 bltcn

哪如果修改称quantize(4)，是不是就等同于int4的模型库

是的

Jun 29 '23 09:06 Whylickspittle

还是希望有int8的库，不然要下载的文件太多了

Jul 03 '23 03:07 Alex-Zuo-One

文档上有

model = AutoModel.from_pretrained("THUDM/chatglm2-6b", trust_remote_code=True).quantize(8).cuda()

清华的那个下载站上面没有

Jul 04 '23 05:07 likunpm

1080ti上面int8似乎没加速，大家有遇到吗？

Jul 11 '23 06:07 shesung

还是希望有int8的库，不然要下载的文件太多了

下载THUDM/chatglm2-6b这个，其他的加载的时候配置化去量化

Aug 04 '23 07:08 PeterXiaTian