PaddleOCR icon indicating copy to clipboard operation
PaddleOCR copied to clipboard

Awesome multilingual OCR toolkits based on PaddlePaddle (practical ultra lightweight OCR system, support 80+ languages recognition, provide data annotation and synthesis tools, support training and de...

Results 1088 PaddleOCR issues
Sort by recently updated
recently updated
newest added

请提供下述完整信息以便快速定位问题/Please provide the following information to quickly locate the problem - 系统环境/System Environment: - onnxruntime-gpu==1.9.0 在使用onnxruntime-gpu进行推理时发现一张图片耗时在3s以上,继续传入相同图片耗时下降到0.5s。更换图片传入耗时又在3s左右

您好,使用自己的数据集,训练表格SLANet模型,训练过程中loc_loss 一直为0 ,60次epoch,structure_loss 就正常,而且,acc也会在0.5以上,找不到原因,batch_size 为12。 谢谢!

请提供下述完整信息以便快速定位问题/Please provide the following information to quickly locate the problem - 系统环境/System Environment:uabntu 18 - 版本号/Version:Paddle: PaddleOCR: 问题相关组件/Related components: - paddle 2.3.2 cuda 10.2 cudnn 8.2 - 运行指令/Command Code: python3...

注意到V2和V3版本ctc head部分的区别。 V2版本的ctc head中间加了一个mid_channels即增加了一个中间全连接层,当时发布的V2的技术文档也提到增加了这个中间全连接层的作用是,增强head的表达能力。 但V3版本ctc head部分又去掉了这个中间全连接层mid_channels,请问这么做的原因是什么,是因为这个中间全连接层会导致V3的精度降低吗?有做过这方面的实验吗?

https://github.com/PaddlePaddle/PaddleOCR/blob/a67a6fa382cbf55aff12154d0fd3635c3a980b07/tools/infer/predict_rec.py#L110 https://github.com/PaddlePaddle/PaddleOCR/blob/a67a6fa382cbf55aff12154d0fd3635c3a980b07/tools/infer/predict_rec.py#L117 https://github.com/PaddlePaddle/PaddleOCR/blob/a67a6fa382cbf55aff12154d0fd3635c3a980b07/tools/infer/predict_rec.py#L120 假设一张图片A的size是(3, 39, 305) 情况一:batch内的max_wh_ratio即为A的ratio 那么imgW = int(32*(305/39) = 250,即图片A在此batch内的resized_w = 250 情况二:batch内的A的ratio不是最大,假设max_wh_ratio=10 那么imgW = int(32*10) = 320, 此时图片A会执行resized_w = int(math.ceil(imgH * ratio)) ,图片在此batch内的resize_w = 251 在并发的场景下,同一张图片在不同的batch里可能会得到不同的处理结果,从而导致同一张图多次调用会出现不同的识别结果 解决方法:...

貌似在源码里写死了,我图片是56*56的,试了一下训练配置文件改为image_shape: [3, 48, 48],源码改为params.rec_image_shape = "3, 48, 48",又快又准。但项目不能改源码,未来有可能开放自定义rec_image_shape参数吗 if params.ocr_version == 'PP-OCRv3': params.rec_image_shape = "3, 48, 320" else: params.rec_image_shape = "3, 32, 320"

- Win10 64位 企业版 VS2017社区版 -PaddleOCR v2.6 GPU版本 , CUDA10.1, cudnn-10.1-windows10-x64-v7.6.5.32,TensorRT-6.0.1.5.Windows10.x86_64.cuda-10.1.cudnn7.6 - 运行指令/Command Code: - 控制台运行指令:ppocr.exe --det_model_dir=./model_1/en_PP-OCRv3_det_infer/ --rec_model_dir=./model_1/en_PP-OCRv3_rec_infer/ --image_dir=./imgs/ - 控制台运行结果正常: - I0919 19:55:04.800885 7316 naive_executor.cc:102] --- skip [feed], feed...

paddeocr 64位可以编译通过并且顺利运行。 我尝试编译paddeocr 为32位 但是发现其中依赖的mklml.dll等库不支持32位的 请问有什么办法吗? 我是想通过32位的EXE调用 paddleocr

2.2版本,c++使用paddleOcr, 创建多个线程,每个线程参考c++示例,同时识别多张图片,发现predictor->Run()这个函数经常崩溃,加锁后恢复正常,这个有人遇到过吗

请提供下述完整信息以便快速定位问题/Please provide the following information to quickly locate the problem - 系统环境/System Environment:Ubuntu 18.04 LTS - 版本号/Version:Paddle: 2.3.1.post116 PaddleOCR: 2.6.0.1 问题相关组件/Related components: - 运行指令/Command Code: ``` import os import cv2...