PaddleOCR
PaddleOCR copied to clipboard
Awesome multilingual OCR toolkits based on PaddlePaddle (practical ultra lightweight OCR system, support 80+ languages recognition, provide data annotation and synthesis tools, support training and de...
#### 问题描述 / Problem Description 使用表格计算输出teds指标索引取值报错 #### 复现代码 / Reproduction Code python table/eval_table.py --det_model_dir=D:\PycharmProjects\PaddleOCR\inference\ch_PP-OCRv4_det_server_infer --rec_model_dir=D:\PycharmProjects\PaddleOCR\inference\ch_PP-OCRv4_rec_server_infer --table_model_dir=D:\PycharmProjects\PaddleOCR\inference\table_batch12_lr0.000064 --image_dir=D:\PycharmProjects\PaddleOCR\train_data\table_images --table_char_dict_path=../ppocr/utils/dict/table_structure_dict.txt --det_limit_side_len=736 --det_limit_type=min --gt_path=D:\PycharmProjects\PaddleOCR\train_data\table_images\convert_label2html.txt #### 完整报错 / Complete Error Message Traceback (most recent...
#### 问题描述 / Problem Description Version compatible issue #### 运行环境 / Runtime Environment - OS: ubuntu 24.04 - Paddle: paddlepaddle-gpu==2.6.1.post120 - PaddleOCR: 2.8.3 - CUDA: 12.2 RTX4090 #### 复现代码 /...
#### 问题描述 / Problem Description I tested the PGNet downloaded from the link provided in the doc on TotalText test set, the numbers I got was lower than reported in...
#### 问题描述 / Problem Description 如题:我在centos7上通过hub serving 启动了structure_table 服务,服务是调通了,但是返回结果是:{"msg":"list index out of range","results":"","status":"101"}不知道是什么意思,肯定是没有成功,服务是通的。 模型如下截图 data:image/s3,"s3://crabby-images/79134/79134a6492b62444d8f216aa569325cf46127581" alt="image" 服务是调通了,截图如下: #### 运行环境 / Runtime Environment - OS: centos7 部署服务,windows ide java业务调用服务 - Paddle: 2.6.1...
I can help with Turkish language. _Originally posted by @fcakyon in https://github.com/PaddlePaddle/PaddleOCR/issues/1048#issuecomment-750784603_ yardımcı olabilir misiniz?
#### 问题描述 / Problem Description I've been going through a problem since a month where (Specially for PPOCRv4) if I change the Image Resolution to [3,32,150] instead of default [3,48,320]....
### 问题描述 现有仓库下文档散落在各个目录下,不利于小伙伴查找和使用。 ### 解决方案 采用[mkdocs-material](https://squidfunk.github.io/mkdocs-material/) + Github Pages搭建更加现在化文档站点。 ### 特色 - 支持中英文搜索,更加快速找打自己所需 - 文档支持中英两种语言,当然也可以支持更多语言,欢迎有意向翻译的小伙伴,[戳这里](https://github.com/PaddlePaddle/PaddleOCR/discussions/13374) - 文档带有评论系统,可以基于某篇文档,提出自己疑问、看法等 - 更多特色,静待自己去挖掘
#### 问题描述 / Problem Description 飞桨官网的通用OCR体验(https://aistudio.baidu.com/community/app/91660/webUI),识别效果比本地运行python3 tools/infer/predict_det.py 推理的效果好很多。 据悉官网版本用的模型并不特殊,能否提供官网体验版本服务化部署的代码和前后处理和http请求的图片编解码方式相关代码,以定位问题原因? #### 运行环境 / Runtime Environment - OS: Docker - Paddle: 2.3.2 - PaddleOCR: 2.6 #### 复现代码 / Reproduction Code python3 tools/infer/predict_det.py
问题
通用文字识别,多语言的,组成一个包含各种语言的字典去识别的更好些,还是去分语种呢,分语言,还要对文本进行分类,流程较多
程序开始实例化paddleocr类,开启mkldnn加速 data:image/s3,"s3://crabby-images/f529a/f529a12606a632dffb1065569fa48eb654b502fa" alt="image" 后循环执行对pdf文件的文字识别。 出现的问题是正常执行一个pdf文件的识别,报错一个,再正常执行一个,交替出现。 报错内容如下 data:image/s3,"s3://crabby-images/9c8f6/9c8f6f0a5c3589f424ecbdb964c2266a2de9fe97" alt="image" 关闭mkldnn加速后没有此问题。修改为每次对pdf文件进行识别之前重新实例化paddleocr类,也无此问题。但这样解决会导致时间大幅增加。 更换最新的paddleocr2.8.0版本无法解决。 请问这个问题的出现是什么因素导致的,以及解决的思路。或有无除了mkldnn之外其他的cpu加速方式?