FastDeploy icon indicating copy to clipboard operation
FastDeploy copied to clipboard

deeplabv3p的onnx模型使用GPU+FP16推理耗时增加

Open zyz207 opened this issue 9 months ago • 2 comments


温馨提示:根据社区不完全统计,按照模板提问,可以加快回复和解决问题的速度


环境

  • 【FastDeploy版本】:release 1.0.0
  • 【编译命令】
  • 【系统平台】: Windows x64(Windows10)
  • 【硬件】: Nvidia GPU 3060, CUDA 11.8 CUDNN 8.5
  • 【编译语言】: C++

【性能问题】 deeplabv3p的onnx模型使用GPU+FP16推理耗时增加,将近翻倍。

zyz207 avatar May 22 '24 08:05 zyz207