blog
blog copied to clipboard

Published 20 hours ago •

Reame
Issues

Update mixtral.md

Open saahil1801 opened this issue 1 year ago • 0 comments

Exllama kernels using GPTQConfig for faster inference and production load. @davanstrien @younesbelkada @pcuenca

Mar 26 '24 13:03 saahil1801