PaddleSlim
PaddleSlim copied to clipboard
经过静态量化后性能却由150ms变为250m
使用Android nnapi方式,硬件为mtk设备。经过将自己的yolov3模型,经过x2paddle转换后,在经过静态离线量化,最后经过动态量化后,性能对比不经过静态量化有150ms变为了250ms。具体见文件:
apu_question.zip
收到,我们安排相关同学看下这个问题。
请提供 paddlepaddle和paddleslim的版本。 如果是较早版本,离线量化并不是全部算子都会量化,导致数据类型和计算IP来回切换从而性能下降
paddlepaddle 2.2.0 paddleslim 2.0.0
@wanghaoshuang @yingshengBD 你好,我这里有个问题跟他差不多,可以麻烦帮我解答下吗,谢谢!!! https://github.com/PaddlePaddle/PaddleSlim/issues/1305#issue-1308604097