PaddleClas icon indicating copy to clipboard operation
PaddleClas copied to clipboard

PULC ARM端推理耗时与官方给出耗时相差较大

Open fengyanWang opened this issue 2 years ago • 2 comments

环境信息:paddlepaddle-gpu 2.2.0.post101 paddlelite 2.11

问题描述:使用高通730g,基于paddle lite推理pulc分类模型(输入为6868),单个大核耗时11毫秒多,和官方的CPU端3毫秒(输入为224224)相差较大,请问是什么原因导致的?(ps:通过对导出的nb模型可视化,发现其包含一个FC层,不知道是不是这个原因,如果是的话,如何替换掉?)

fengyanWang avatar Jul 01 '22 08:07 fengyanWang

官方模型测试使用的CPU是Intel(R) Xeon(R) Gold 6148 CPU @ 2.40GHz,这块在文档中有描述哈,如: image 不同的设备速度不一致。

cuicheng01 avatar Jul 01 '22 08:07 cuicheng01

是Intel(R) Xeon(R) Gold 6148 CPU @ 2.40

那请问如何要将FC层替换成CONV的话,配置文件部分应该怎么修改,会影响效果吗?影响有多大?

fengyanWang avatar Jul 01 '22 08:07 fengyanWang

这一层只是占Params,对FLOPs和速度影响不大

cuicheng01 avatar Jul 01 '22 08:07 cuicheng01