FastDeploy
FastDeploy copied to clipboard

Published 20 hours ago •

Reame
Issues

deeplabv3p的onnx模型使用GPU+FP16推理耗时增加

Open zyz207 opened this issue 9 months ago • 2 comments

温馨提示：根据社区不完全统计，按照模板提问，可以加快回复和解决问题的速度

环境

【FastDeploy版本】：release 1.0.0
【编译命令】
【系统平台】: Windows x64(Windows10)
【硬件】： Nvidia GPU 3060， CUDA 11.8 CUDNN 8.5
【编译语言】： C++

【性能问题】 deeplabv3p的onnx模型使用GPU+FP16推理耗时增加，将近翻倍。

May 22 '24 08:05 zyz207