PaddleOCR ppocrv4 检测模型转tensorrt性能下降严重（着急）

ppocrv4 检测模型转tensorrt性能下降严重（着急）

Open githublsk opened this issue 9 months ago • 5 comments

ppocrv4 检测模型转tensorrt性能下降严重，能否给出解决方案？多谢

系统环境/System Environment：ubuntu18.04
版本号/Version：Paddle：2.7 PaddleOCR：问题相关组件/Related components：onnx
运行指令/Command Code：onnx转tensorrt
完整报错/Complete Error Message：

May 13 '24 09:05 githublsk

可以详细说明一下问题吗？

May 13 '24 09:05 UserWangZz

可以详细说明一下问题吗？

PaddleOCRv4 server端文字检测模型转ONNX准确率并未下降，ONNX转TRT后精度下降70%左右，可以参照之前有几个开发者提出了同样问题： https://github.com/PaddlePaddle/PaddleOCR/issues/10917 https://github.com/PaddlePaddle/PaddleOCR/issues/11419 麻烦帮忙解答一下，非常感谢转换的命令：

May 13 '24 09:05 githublsk

可以详细说明一下问题吗？

能否帮忙解答一下？多谢

May 14 '24 01:05 githublsk

可以尝试使用Fastdeploy进行推理，切换后端为trt：

python infer.py --det_model ch_PP-OCRv4_det_infer --cls_model ch_ppocr_mobile_v2.0_cls_infer --rec_model ch_PP-OCRv4_rec_infer --rec_label_file ppocr_keys_v1.txt --image 12.jpg --device gpu --backend trt

参考：https://github.com/PaddlePaddle/FastDeploy/tree/develop/examples/vision/ocr/PP-OCR/cpu-gpu/python

但需要注意，目前没有在FP16上做过精度验证，确实可能存在精度损失的情况，建议先使用FP32。

May 14 '24 05:05 tink2123

可以尝试使用Fastdeploy进行推理，切换后端为trt：
python infer.py --det_model ch_PP-OCRv4_det_infer --cls_model ch_ppocr_mobile_v2.0_cls_infer --rec_model ch_PP-OCRv4_rec_infer --rec_label_file ppocr_keys_v1.txt --image 12.jpg --device gpu --backend trt
参考：https://github.com/PaddlePaddle/FastDeploy/tree/develop/examples/vision/ocr/PP-OCR/cpu-gpu/python

但需要注意，目前没有在FP16上做过精度验证，确实可能存在精度损失的情况，建议先使用FP32。

谢谢您的答复，检测模型转tensorRT，FP32的看起来也是有问题的，您那边能验证FP32是无问题的？

May 14 '24 09:05 githublsk

PaddleOCR PaddleOCR copied to clipboard

ppocrv4 检测模型转tensorrt性能下降严重（着急）

PaddleOCR
PaddleOCR copied to clipboard