Baichuan2
Baichuan2 copied to clipboard
8bit量化完后做推理的时候是不是要做反量化用FP16计算?
RT
是的