PTQ4ViT
PTQ4ViT copied to clipboard
量化模型的显存占用
请问该方法产生的8 bit量化模型,理想实现下在运行时能减少多少显存占用呢