PaddleClas
PaddleClas copied to clipboard
PULC ARM端推理耗时与官方给出耗时相差较大
环境信息:paddlepaddle-gpu 2.2.0.post101 paddlelite 2.11
问题描述:使用高通730g,基于paddle lite推理pulc分类模型(输入为6868),单个大核耗时11毫秒多,和官方的CPU端3毫秒(输入为224224)相差较大,请问是什么原因导致的?(ps:通过对导出的nb模型可视化,发现其包含一个FC层,不知道是不是这个原因,如果是的话,如何替换掉?)
官方模型测试使用的CPU是Intel(R) Xeon(R) Gold 6148 CPU @ 2.40GHz,这块在文档中有描述哈,如:
不同的设备速度不一致。
是Intel(R) Xeon(R) Gold 6148 CPU @ 2.40
那请问如何要将FC层替换成CONV的话,配置文件部分应该怎么修改,会影响效果吗?影响有多大?
这一层只是占Params,对FLOPs和速度影响不大