PaddleOCR icon indicating copy to clipboard operation
PaddleOCR copied to clipboard

Awesome multilingual OCR toolkits based on PaddlePaddle (practical ultra lightweight OCR system, support 80+ languages recognition, provide data annotation and synthesis tools, support training and de...

Results 1088 PaddleOCR issues
Sort by recently updated
recently updated
newest added

- 版本号/Version:Paddle: PaddleOCR: 问题相关组件/PPOCRLabel: - PPOCRLabel在标注表格结构时,会调用模型预标注。在windows下没有gpu,会很慢。如何能将模型部署到服务器上。 - 或者PPOCRLabel是否可以在centos上安装并使用

我下载v3模型,替换了android demo中的v2模型,运行提示: This model is not supported, because kernel for 'io_copy' is not supported by Paddle-Lite. 我也按照说明下载了paddle lite with extra with cv的so和jar,请问是什么原因?

你好,基于PP-Structure 和layout parser 进行版面分析,如何加载其他模型?比如 picodet_lcnet_x1_0_fgd_layout_cdla, model = lp.PaddleDetectionLayoutModel(model_path="./picodet_lcnet_x1_0_fgd_layout_cdla/",...) 通过这种方式加载本地模型,报错显示 Cannot open file ./picodet_lcnet_x1_0_fgd_layout_cdla/inference.pdmodel,求解答

PP-OCRv3 检测的预训练模型,icdar2015训练集,我用它做评估,发现超出内存,batch_size已经调小到2了 Out of memory error on GPU 0. Cannot allocate 1.189819GB memory on GPU 0, 7.999390GB memory has been allocated and available memory is only 0.000000B.

![image](https://user-images.githubusercontent.com/102579571/196572964-3a74e6fb-ebc2-4889-99de-ba33a7243f56.png)

我的数据集大都是这样的 ![14_3906](https://user-images.githubusercontent.com/95627417/196119724-a655885b-521c-4f98-a365-34b1ad6a4928.jpg) ![16_2398](https://user-images.githubusercontent.com/95627417/196119755-5c65abaf-580e-4904-bd16-f69728bf4109.jpg) 我该如何修改image_shape,才能识别用摄像头抓取的图片里的文本段,而不是因为resize后失真,得不到结果 https://github.com/PaddlePaddle/PaddleOCR/blob/4d3cd67cc23b756a8d67f57b4c6d868b3186b4b6/configs/rec/multi_language/rec_en_number_lite_train.yml#L93-L94 我尝试解决这个问题,通过看源码,infer主要调用了这个函数,但我还是没有思路 https://github.com/PaddlePaddle/PaddleOCR/blob/4d3cd67cc23b756a8d67f57b4c6d868b3186b4b6/ppocr/data/imaug/rec_img_aug.py#L499-L523 假设抓取的图片尺寸是(1080, 1920),我应该如何修改呢,能给予一些提示或者建议吗 或者说我需要利用类似于这样的数据集图片训练? ![samples](https://user-images.githubusercontent.com/95627417/196119957-75bd0a3e-5235-48cc-85f2-ee9d1529e08c.png)

./ppocr/modeling/backbones/vqa_layoutlm.py中这段代码: class NLPBaseModel(nn.Layer): def __init__(self, base_model_class, model_class, mode="base", type="ser", pretrained=True, checkpoints=None, **kwargs): super(NLPBaseModel, self).__init__() if checkpoints is not None: # load the trained model self.model = model_class.from_pretrained(checkpoints) else: # load...

训练文字识别模型 v1、v2的版本大小是[32,320] 文档中说训练中先将图片等比例缩放到高=32时,如果宽大于十倍,也就是大于320则过滤掉该图 而V3的识别模型大小是[48,320]。 那是不是先等比例到高=48,然后宽大于320过滤掉????? 那就不是十倍的比例了。 如果自己的训练集中有较多长文本,时不时应该把训练和预测的大小都修改为[48,480]了?也保持宽高比为10倍的比例???? 请问是该这样调整么

请提供下述完整信息以便快速定位问题/Please provide the following information to quickly locate the problem - 系统环境/System Environment: - 版本号/Version:Paddle: PaddleOCR: 问题相关组件/Related components: - 运行指令/Command Code: - 完整报错/Complete Error Message: requests.exceptions.ConnectionError: HTTPSConnectionPool(host='paddleocr.bj.bcebos.com', port=443): Max retries...

- 系统环境/System Environment:docker pull registry.baidubce.com/paddlepaddle/paddle:latest-dev - 版本号/Version:Paddle:2.3.1 PaddleOCR: develop分支 - 运行模式:静态图,参考代码:https://gitee.com/paddlepaddle/PaddleOCR/blob/develop/tools/train.py?from_wecom=1 (p.s 因为动态图转静态图工具有问题,因此直接运行静态图版本) - 单机单卡 - 完整报错/Complete Error Message: - V100上: hmean≈0.67,precision≈0.75,recall≈0.59,hmean应该可以接近0.70。 ![image](https://user-images.githubusercontent.com/58928121/196323853-126b9dad-16bf-4f0e-b7a9-0e9988c9319d.png) - 在国产AI训练芯片上:hmean≈0.54,precision≈0.73,recall≈0.43 ![image](https://user-images.githubusercontent.com/58928121/196324549-5749c88c-1396-40e9-8a86-52d453269008.png) 其他说明:bs=16、inputsize=736*1280,数据集:ICDAR2015 需求:期望能DBNet的hmean达到0.70,想问问paddleocr或者是paddle框架同学看看,我们需要怎么修改,提供一些指导建议,如果方便的话可以微信沟通联系,我方可以提供log日志,训练文件,源码等,谢谢~