deepvac [BUG] 转换的TNN模型在华为麒麟处理器上opencl（GPU）比cpu速度慢

[BUG] 转换的TNN模型在华为麒麟处理器上opencl（GPU）比cpu速度慢

Open gemfield opened this issue 3 years ago • 0 comments

bug描述 我们将ESP网络转换成TNN模型部署在华为手机上和骁龙处理器手机上。在骁龙处理器手机上，GPU/opencl 是cpu模型推理速度的2倍，而在华为麒麟980手机上，GPU/opencl 比cpu模型推理速度还要慢（从13fps下降到10fps）。

如何复现 复现步骤:

预期结果 华为麒麟980手机上，GPU/opencl 应该大于等于cpu的推理速度。

截图如果有必要的话，请添加截图。

如果使用的是MLab HomePod，请填写

Aug 11 '21 08:08 gemfield