InternVL
InternVL copied to clipboard
InternVL−Chat−V1.5-Int8的耗时是InternVL−Chat−V1.5的三倍吗?
InternVL−Chat−V1.5-Int8的耗时是InternVL−Chat−V1.5的三倍吗?我在A100上进行测试,同样的数据,InternVL−Chat−V1.5耗时550秒,InternVL−Chat−V1.5-Int8耗时1810秒
Int8虽然省显存了,但是推理会变慢
请问模型效果会变差吗