PaddleOCR issues

PPOCRLabel在标注表格结构时很慢

11

- 版本号/Version：Paddle： PaddleOCR：问题相关组件/PPOCRLabel： - PPOCRLabel在标注表格结构时，会调用模型预标注。在windows下没有gpu，会很慢。如何能将模型部署到服务器上。 - 或者PPOCRLabel是否可以在centos上安装并使用

PC-god

android demo加载v3模型出错

我下载v3模型，替换了android demo中的v2模型，运行提示： This model is not supported, because kernel for 'io_copy' is not supported by Paddle-Lite. 我也按照说明下载了paddle lite with extra with cv的so和jar，请问是什么原因？

simpsonyang

你好，基于PP-Structure 和layout parser 进行版面分析，如何加载其他模型？比如 picodet_lcnet_x1_0_fgd_layout_cdla， model = lp.PaddleDetectionLayoutModel(model_path="./picodet_lcnet_x1_0_fgd_layout_cdla/",...) 通过这种方式加载本地模型，报错显示 Cannot open file ./picodet_lcnet_x1_0_fgd_layout_cdla/inference.pdmodel，求解答

JackMeiLong

评估时内存溢出

10

PP-OCRv3 检测的预训练模型，icdar2015训练集，我用它做评估，发现超出内存，batch_size已经调小到2了 Out of memory error on GPU 0. Cannot allocate 1.189819GB memory on GPU 0, 7.999390GB memory has been allocated and available memory is only 0.000000B.

playgit2001

请问各位这样的样本有什么优化的方案吗？

4

![image](https://user-images.githubusercontent.com/102579571/196572964-3a74e6fb-ebc2-4889-99de-ba33a7243f56.png)

lilianjie111111

训练了一个能够同时识别竖排和横排文字的模型,但在推理时碰到了图片尺寸的问题

1

我的数据集大都是这样的 ![14_3906](https://user-images.githubusercontent.com/95627417/196119724-a655885b-521c-4f98-a365-34b1ad6a4928.jpg) ![16_2398](https://user-images.githubusercontent.com/95627417/196119755-5c65abaf-580e-4904-bd16-f69728bf4109.jpg) 我该如何修改image_shape,才能识别用摄像头抓取的图片里的文本段,而不是因为resize后失真,得不到结果 https://github.com/PaddlePaddle/PaddleOCR/blob/4d3cd67cc23b756a8d67f57b4c6d868b3186b4b6/configs/rec/multi_language/rec_en_number_lite_train.yml#L93-L94 我尝试解决这个问题,通过看源码,infer主要调用了这个函数,但我还是没有思路 https://github.com/PaddlePaddle/PaddleOCR/blob/4d3cd67cc23b756a8d67f57b4c6d868b3186b4b6/ppocr/data/imaug/rec_img_aug.py#L499-L523 假设抓取的图片尺寸是(1080, 1920),我应该如何修改呢,能给予一些提示或者建议吗或者说我需要利用类似于这样的数据集图片训练? ![samples](https://user-images.githubusercontent.com/95627417/196119957-75bd0a3e-5235-48cc-85f2-ee9d1529e08c.png)

Like2021

kie中ser模型训练问题，如何不加载预训练模型直接训练，预训练模型如何训练的

2

./ppocr/modeling/backbones/vqa_layoutlm.py中这段代码： class NLPBaseModel(nn.Layer): def __init__(self, base_model_class, model_class, mode="base", type="ser", pretrained=True, checkpoints=None, **kwargs): super(NLPBaseModel, self).__init__() if checkpoints is not None: # load the trained model self.model = model_class.from_pretrained(checkpoints) else: # load...

aaferrero

训练文字识别模型中的宽高比问题

1

训练文字识别模型 v1、v2的版本大小是[32,320] 文档中说训练中先将图片等比例缩放到高=32时，如果宽大于十倍，也就是大于320则过滤掉该图而V3的识别模型大小是[48,320]。那是不是先等比例到高=48，然后宽大于320过滤掉？？？？？那就不是十倍的比例了。如果自己的训练集中有较多长文本，时不时应该把训练和预测的大小都修改为[48,480]了？也保持宽高比为10倍的比例？？？？请问是该这样调整么

ainndejj11

老师，pyinstaller打包后的paddleocr报HTTPSconnectionPool错误该怎么解决呀

1

请提供下述完整信息以便快速定位问题/Please provide the following information to quickly locate the problem - 系统环境/System Environment： - 版本号/Version：Paddle： PaddleOCR：问题相关组件/Related components： - 运行指令/Command Code： - 完整报错/Complete Error Message： requests.exceptions.ConnectionError: HTTPSConnectionPool(host='paddleocr.bj.bcebos.com', port=443): Max retries...

l1uuuuu

DBNet 训练精度问题

2

- 系统环境/System Environment：docker pull registry.baidubce.com/paddlepaddle/paddle:latest-dev - 版本号/Version：Paddle：2.3.1 PaddleOCR： develop分支 - 运行模式：静态图，参考代码：https://gitee.com/paddlepaddle/PaddleOCR/blob/develop/tools/train.py?from_wecom=1 （p.s 因为动态图转静态图工具有问题，因此直接运行静态图版本） - 单机单卡 - 完整报错/Complete Error Message： - V100上: hmean≈0.67，precision≈0.75，recall≈0.59，hmean应该可以接近0.70。 ![image](https://user-images.githubusercontent.com/58928121/196323853-126b9dad-16bf-4f0e-b7a9-0e9988c9319d.png) - 在国产AI训练芯片上：hmean≈0.54，precision≈0.73，recall≈0.43 ![image](https://user-images.githubusercontent.com/58928121/196324549-5749c88c-1396-40e9-8a86-52d453269008.png) 其他说明：bs=16、inputsize=736*1280，数据集：ICDAR2015 需求：期望能DBNet的hmean达到0.70，想问问paddleocr或者是paddle框架同学看看，我们需要怎么修改，提供一些指导建议，如果方便的话可以微信沟通联系，我方可以提供log日志，训练文件，源码等，谢谢~

adaxiadaxi

PaddleOCR
PaddleOCR copied to clipboard

Metadata

PPOCRLabel在标注表格结构时很慢

android demo加载v3模型出错

PP-Structure 加载其他模型

评估时内存溢出

请问各位这样的样本有什么优化的方案吗？

训练了一个能够同时识别竖排和横排文字的模型,但在推理时碰到了图片尺寸的问题

kie中ser模型训练问题，如何不加载预训练模型直接训练，预训练模型如何训练的

训练文字识别模型中的宽高比问题

老师，pyinstaller打包后的paddleocr报HTTPSconnectionPool错误该怎么解决呀

DBNet 训练精度问题

← Metadata

Owner

Metadata

PaddleOCR PaddleOCR copied to clipboard

Metadata

← Metadata

Owner

Metadata

PaddleOCR
PaddleOCR copied to clipboard