Paddle-Lite icon indicating copy to clipboard operation
Paddle-Lite copied to clipboard

Amazing Cost when picodet running mali T8xx gpu!

Open 2050airobert opened this issue 2 years ago • 3 comments

hi, 1 参考detection最新 2.4 release版本,用最新的opt 以及最新的developy lite版本转换该picodet xs 320的模型到gpu模型, https://github.com/PaddlePaddle/PaddleDetection/tree/release/2.4/deploy/lite 2 转换成功之后,在rk3399pro上运行gpu模型,./main_withgpubin_save_fp16 det_runtime_config.json ,发现可以正常的运行gpu模型,输出检测结果,基本正确,但是耗时1s左右,有点太大了,感觉有点奇怪,这个模型在arm上跑也就是100ms不到,差距太大。 主要log如下: image 3 请注意上面log中还隐藏了一个问题,就是 lite_opencl_tuned.bin没有成功找到,但是lite_opencl_kernel.bin生成并且成功load 加载成功了。 [I 7/ 5 8:31:20.547 ...-Lite/lite/backends/opencl/cl_runtime.cc:863 set_auto_tune] tuned_file:/data/local/tmp//lite_opencl_tuned.bin [W 7/ 5 8:31:20.547 ...-Lite/lite/backends/opencl/cl_runtime.cc:872 set_auto_tune] Not found tuned file:/data/local/tmp//lite_opencl_tuned.bin [I 7/ 5 8:31:20.547 ...v0630/Paddle-Lite/lite/api/paddle_api.cc:341 set_opencl_tune] set opencl_tune_mode: CL_TUNE_NONE, lws_repeats:4 [I 7/ 5 8:31:20.547 ...v0630/Paddle-Lite/lite/api/paddle_api.cc:344 set_opencl_tune] tuned file path & name:/data/local/tmp//lite_opencl_tuned.bin 4 请问下 目前是否有picodet xs 320 x 320 在rk3399pro 或者 mali gpuT860 系列跑通的case,若没有何时可以发布,另外我目前的耗时结果基本符合lite的预期吗? 多谢 5 在上述的基础之后,继续运行完整的picodet+tinypose的例子,输入图片为单人的或者多人的都进行了尝试,比如当单人的时候,log显示可以检测到其中的一个行人,但是后续就崩了,无法连续跑tinypose检测模型(我确认tinypose是opencl 正常的模型 ,因为如果调整阈值就可以跑通,但是结果也是不对,没有检测出任何关键点) 。具体log如下 image 我的配置文件如下 image (备注: 原始阈值为 0.5 0.5 是可以运行结束的,但是检不出人,detection 阈值必须改为小一些的,检测出行人后,关键点检测结果就崩了)

BR

2050airobert avatar Jul 05 '22 08:07 2050airobert

两个模型串行崩溃,可以先一个个模型跑一下试试,你如果想定位问题就要尽量剥离业务代码,现在的描述太复杂很难确定到底是不是库的问题。想看更全面的log可以编译时加上with_log=ON,然后运行时export GLOG_v=4.

mjp9527 avatar Jul 05 '22 11:07 mjp9527

是的,大佬。但是要跑tinypose必须给定一个检测到的行人才行啊。 另外前面好几个问题,您能帮忙或者找大佬看下吗? 多谢

2050airobert avatar Jul 05 '22 12:07 2050airobert

hello,anyone could help ?

2050airobert avatar Jul 06 '22 03:07 2050airobert