PaddleOCR icon indicating copy to clipboard operation
PaddleOCR copied to clipboard

ppocrv4 检测模型转tensorrt性能下降严重(着急)

Open githublsk opened this issue 9 months ago • 5 comments

ppocrv4 检测模型转tensorrt性能下降严重,能否给出解决方案?多谢

  • 系统环境/System Environment:ubuntu18.04
  • 版本号/Version:Paddle:2.7 PaddleOCR: 问题相关组件/Related components:onnx
  • 运行指令/Command Code:onnx转tensorrt
  • 完整报错/Complete Error Message:

githublsk avatar May 13 '24 09:05 githublsk

可以详细说明一下问题吗?

UserWangZz avatar May 13 '24 09:05 UserWangZz

可以详细说明一下问题吗?

PaddleOCRv4 server端文字检测模型转ONNX准确率并未下降,ONNX转TRT后精度下降70%左右,可以参照之前有几个开发者提出了同样问题: https://github.com/PaddlePaddle/PaddleOCR/issues/10917 https://github.com/PaddlePaddle/PaddleOCR/issues/11419 麻烦帮忙解答一下,非常感谢 转换的命令: image

githublsk avatar May 13 '24 09:05 githublsk

可以详细说明一下问题吗?

能否帮忙解答一下?多谢

githublsk avatar May 14 '24 01:05 githublsk

可以尝试使用Fastdeploy进行推理,切换后端为trt:

python infer.py --det_model ch_PP-OCRv4_det_infer --cls_model ch_ppocr_mobile_v2.0_cls_infer --rec_model ch_PP-OCRv4_rec_infer --rec_label_file ppocr_keys_v1.txt --image 12.jpg --device gpu --backend trt

参考:https://github.com/PaddlePaddle/FastDeploy/tree/develop/examples/vision/ocr/PP-OCR/cpu-gpu/python

但需要注意,目前没有在FP16上做过精度验证,确实可能存在精度损失的情况,建议先使用FP32。

tink2123 avatar May 14 '24 05:05 tink2123

可以尝试使用Fastdeploy进行推理,切换后端为trt:

python infer.py --det_model ch_PP-OCRv4_det_infer --cls_model ch_ppocr_mobile_v2.0_cls_infer --rec_model ch_PP-OCRv4_rec_infer --rec_label_file ppocr_keys_v1.txt --image 12.jpg --device gpu --backend trt

参考:https://github.com/PaddlePaddle/FastDeploy/tree/develop/examples/vision/ocr/PP-OCR/cpu-gpu/python

但需要注意,目前没有在FP16上做过精度验证,确实可能存在精度损失的情况,建议先使用FP32。

谢谢您的答复,检测模型转tensorRT,FP32的看起来也是有问题的,您那边能验证FP32是无问题的?

githublsk avatar May 14 '24 09:05 githublsk