PaddleOCR issues

转换成onnx模型后使用gpu推理速度比cpu还慢

1

请提供下述完整信息以便快速定位问题/Please provide the following information to quickly locate the problem - 系统环境/System Environment： - onnxruntime-gpu==1.9.0 在使用onnxruntime-gpu进行推理时发现一张图片耗时在3s以上，继续传入相同图片耗时下降到0.5s。更换图片传入耗时又在3s左右

MgArcher

表格模型SLANet训练过程中位置坐标损失 loc_loss 一直为0

1

您好，使用自己的数据集，训练表格SLANet模型，训练过程中loc_loss 一直为0 ，60次epoch，structure_loss 就正常，而且，acc也会在0.5以上，找不到原因，batch_size 为12。谢谢！

chx-xuan

RUN RARE Inference

2

请提供下述完整信息以便快速定位问题/Please provide the following information to quickly locate the problem - 系统环境/System Environment：uabntu 18 - 版本号/Version：Paddle： PaddleOCR：问题相关组件/Related components： - paddle 2.3.2 cuda 10.2 cudnn 8.2 - 运行指令/Command Code： python3...

cqray1990

有关V2和V3版本ctc head的部分区别问题

7

注意到V2和V3版本ctc head部分的区别。 V2版本的ctc head中间加了一个mid_channels即增加了一个中间全连接层，当时发布的V2的技术文档也提到增加了这个中间全连接层的作用是，增强head的表达能力。但V3版本ctc head部分又去掉了这个中间全连接层mid_channels，请问这么做的原因是什么，是因为这个中间全连接层会导致V3的精度降低吗？有做过这方面的实验吗？

ziyaxuanyi

并发场景下识别batch推理环节resize_norm_img会使同一张图在不同batch里的处理结果不同导致识别结果会变化

4

https://github.com/PaddlePaddle/PaddleOCR/blob/a67a6fa382cbf55aff12154d0fd3635c3a980b07/tools/infer/predict_rec.py#L110 https://github.com/PaddlePaddle/PaddleOCR/blob/a67a6fa382cbf55aff12154d0fd3635c3a980b07/tools/infer/predict_rec.py#L117 https://github.com/PaddlePaddle/PaddleOCR/blob/a67a6fa382cbf55aff12154d0fd3635c3a980b07/tools/infer/predict_rec.py#L120 假设一张图片A的size是（3， 39， 305）情况一：batch内的max_wh_ratio即为A的ratio 那么imgW = int(32*(305/39) = 250，即图片A在此batch内的resized_w = 250 情况二：batch内的A的ratio不是最大，假设max_wh_ratio=10 那么imgW = int(32*10) = 320, 此时图片A会执行resized_w = int(math.ceil(imgH * ratio)) ，图片在此batch内的resize_w = 251 在并发的场景下，同一张图片在不同的batch里可能会得到不同的处理结果，从而导致同一张图多次调用会出现不同的识别结果解决方法：...

KevinNuNu

未来有可能开放自定义rec_image_shape参数吗

2

貌似在源码里写死了，我图片是56*56的，试了一下训练配置文件改为image_shape: [3, 48, 48]，源码改为params.rec_image_shape = "3, 48, 48"，又快又准。但项目不能改源码，未来有可能开放自定义rec_image_shape参数吗 if params.ocr_version == 'PP-OCRv3': params.rec_image_shape = "3, 48, 320" else: params.rec_image_shape = "3, 32, 320"

VieteChen

PaddleOCR-2.6 GPU版本MFC运行报错：无法定位程序输入点dnnl_prelu_backward_desc_init于动态链接库paddle_inference.dll上

1

- Win10 64位企业版 VS2017社区版 -PaddleOCR v2.6 GPU版本， CUDA10.1, cudnn-10.1-windows10-x64-v7.6.5.32，TensorRT-6.0.1.5.Windows10.x86_64.cuda-10.1.cudnn7.6 - 运行指令/Command Code： - 控制台运行指令：ppocr.exe --det_model_dir=./model_1/en_PP-OCRv3_det_infer/ --rec_model_dir=./model_1/en_PP-OCRv3_rec_infer/ --image_dir=./imgs/ - 控制台运行结果正常： - I0919 19:55:04.800885 7316 naive_executor.cc:102] --- skip [feed], feed...

stq054188

请问paddleocr可以编译32位的吗？

1

paddeocr 64位可以编译通过并且顺利运行。我尝试编译paddeocr 为32位但是发现其中依赖的mklml.dll等库不支持32位的请问有什么办法吗？我是想通过32位的EXE调用 paddleocr

iknow34languages

predictor->Run()在多线程下崩溃问题

5

2.2版本，c++使用paddleOcr，创建多个线程，每个线程参考c++示例，同时识别多张图片，发现predictor->Run()这个函数经常崩溃，加锁后恢复正常，这个有人遇到过吗

GamePlayerScript

Error in loading PDF file

3

请提供下述完整信息以便快速定位问题/Please provide the following information to quickly locate the problem - 系统环境/System Environment：Ubuntu 18.04 LTS - 版本号/Version：Paddle： 2.3.1.post116 PaddleOCR： 2.6.0.1 问题相关组件/Related components： - 运行指令/Command Code： ``` import os import cv2...

Matthieu-Tinycoaching

PaddleOCR
PaddleOCR copied to clipboard

Metadata

转换成onnx模型后使用gpu推理速度比cpu还慢

表格模型SLANet训练过程中位置坐标损失 loc_loss 一直为0

RUN RARE Inference

有关V2和V3版本ctc head的部分区别问题

并发场景下识别batch推理环节resize_norm_img会使同一张图在不同batch里的处理结果不同导致识别结果会变化

未来有可能开放自定义rec_image_shape参数吗

PaddleOCR-2.6 GPU版本MFC运行报错：无法定位程序输入点dnnl_prelu_backward_desc_init于动态链接库paddle_inference.dll上

请问paddleocr可以编译32位的吗？

predictor->Run()在多线程下崩溃问题

Error in loading PDF file

← Metadata

Owner

Metadata

PaddleOCR PaddleOCR copied to clipboard

Metadata

← Metadata

Owner

Metadata

PaddleOCR
PaddleOCR copied to clipboard