torchtune
torchtune copied to clipboard

Published 20 hours ago •

Implement quantized model inference for `generate_v2`

Open SalmanMohammadi opened this issue 4 months ago • 0 comments

We'll probably also need #1782.

Oct 11 '24 15:10 SalmanMohammadi

enhancement

high-priority

inference