liuyunrui123
liuyunrui123
> 最新版本的 AutoGPTQ 已经支持 MOSS 模型的量化,今晚我会把量化后的模型权重上传至 huggingface hub 链接给一个,谢谢
GPTq量化的llama本来就不用triton,Windows上用没问题
在多轮对话模式下,我也遇到了这个问题,偶尔会触发,如下图 
you can try this PR: `https://github.com/lvgl/lv_binding_micropython/pull/278`
> @duzx16 显存的问题目前已经解决了~ 有GPTQ量化后的模型地址吗,体验下
另外还有个现象,如果设置chatglm-6b模型为默认启动选择的模型,那么启动后是直接占用了原有的双倍显存,聊天就会爆显存
I also have the same problem on win10
文件是能上传了,但markdown里没有任何显示,在后台能看到文件被上传了。
check your menuconfig, make sure `Hardware Drivers`->`Enable LCD on SPI0`->`lcd scan direction` select `DIR_YX_LRUD`