smoothquant How to use SmoothQuant in FasterTransformer?

How to use SmoothQuant in FasterTransformer?

Open jiangsongHW opened this issue 1 year ago • 1 comments

I have build and run FasterTransformer. I see there is a parameter --int8_mode in FasterTransformer,. will it use SmoothQuant as default, if I set int8_mode =1?

if not is there any example of using SmoothQuant in FasterTransformer ?

thank you!

Apr 17 '23 11:04 jiangsongHW

https://github.com/NVIDIA/FasterTransformer/blob/main/docs/gpt_guide.md

May 28 '23 07:05 pineking

smoothquant smoothquant copied to clipboard

How to use SmoothQuant in FasterTransformer?

smoothquant
smoothquant copied to clipboard