PaddleOCR
PaddleOCR copied to clipboard
Awesome multilingual OCR toolkits based on PaddlePaddle (practical ultra lightweight OCR system, support 80+ languages recognition, provide data annotation and synthesis tools, support training and de...
请提供下述完整信息以便快速定位问题/Please provide the following information to quickly locate the problem - 系统环境/System Environment: - 版本号/Version:Paddle: PaddleOCR: 问题相关组件/Related components: - 运行指令/Command Code: - 完整报错/Complete Error Message:
 ,使用det_r50_db++_icdar15.yml,进行训练,  ,训练过程算正常?使用小批量数据进行测试时,也是这样,效果不行
请提供下述完整信息以便快速定位问题/Please provide the following information to quickly locate the problem - 系统环境/System Environment:Windows 10 - 版本号/Version: paddle-bfloat==0.1.7 paddleocr==2.6.0.1 paddlepaddle==2.3.2 PPOCRLabel==2.1.0 问题相关组件/Related components:PPOCRLabel - 运行指令/Command Code:PPOCRLabel --lang ch - 完整报错/Complete Error...
例如,身份证和表格(有些身份证中文上面是有相应的英文字母的) 只想要中文的部分,那么英文字母,在训练检测模型时,可以不标注图片中英文的部分,只标注图片中文的部分么,对检测模型效果会有影响吗?? 还是都需要标,在后处理时候,在判断英文的部分,给它筛除掉?
请问,我现在训练V3-cml的蒸馏模型,检测的训练集有8000多张,一张显卡,batch-size最大设置为3。 请问学习率应该设置多少呢??? 看官方的finetune文档,里面说单卡bs=4,学习率设置5e-5 (0.0005) 这样会不会太小了? 我设置的epoch=500, lr=0.0005 训练了17个epoch了,指标效果不太好,并且best_epoch还一直是第二个epoch。 请问怎么设置学习率合适呢?
请提供下述完整信息以便快速定位问题/Please provide the following information to quickly locate the problem - 系统环境/System Environment:x86_64 DISTRIB_ID=Ubuntu DISTRIB_RELEASE=18.04 DISTRIB_CODENAME=bionic DISTRIB_DESCRIPTION="Ubuntu 18.04.3 LTS" NAME="Ubuntu" VERSION="18.04.3 LTS (Bionic Beaver)" ID=ubuntu ID_LIKE=debian PRETTY_NAME="Ubuntu 18.04.3 LTS" VERSION_ID="18.04"...
训练数据集
请提供下述完整信息以便快速定位问题/Please provide the following information to quickly locate the problem - 系统环境/System Environment:Linux - 版本号/Version:Paddle:2.6 PaddleOCR: 问题相关组件/Related components: - 运行指令/Command Code:python3 tools/train.py -c configs/kie/vi_layoutxlm/re_vi_layoutxlm_xfund_zh.yml - 完整报错/Complete Error Message: [2022/09/13 17:21:04]...
- 系统环境/System Environment:mac os 11.0.1 - 版本号/Version:Paddle: 2.2.1 - PaddleOCR: 2.5 - 问题相关组件/Related components:PPOCRLabel - 复现方式: 1. 标注完成一张图之后 2. ctrl+s 保存 3. check确认,并切换下一张图 4. 开启标注(按W/Q,或手动点击”矩形标注/多点标注“) 5. 鼠标在图片上开始标注,即刻闪退。 - 完整报错/Complete Error...
识别问题
 像这种图片,一个字也识别不出来,试过调整图片的大小,也是一样的。请问下,应该怎么处理呢?
I am using pp-structure library from paddleocr to extract tables from images.  I get this result for above image:- ``` result = {'type': 'table', 'bbox': [0, 0, 349, 71],...