FastDeploy
FastDeploy copied to clipboard
deeplabv3p的onnx模型使用GPU+FP16推理耗时增加
温馨提示:根据社区不完全统计,按照模板提问,可以加快回复和解决问题的速度
环境
- 【FastDeploy版本】:release 1.0.0
- 【编译命令】
- 【系统平台】: Windows x64(Windows10)
- 【硬件】: Nvidia GPU 3060, CUDA 11.8 CUDNN 8.5
- 【编译语言】: C++
【性能问题】 deeplabv3p的onnx模型使用GPU+FP16推理耗时增加,将近翻倍。