PaddleOCR
PaddleOCR copied to clipboard
Awesome multilingual OCR toolkits based on PaddlePaddle (practical ultra lightweight OCR system, support 80+ languages recognition, provide data annotation and synthesis tools, support training and de...
训练OCR的图片的大小基本是小于50K左右的图片,分辨率大概是200多×200多,使用ResNet50_vd_ssld_pretrained对数据进行训练,训练的图片数据是1385张,训练的次数是1200次 test文件夹的图片是277张,train文件夹的图片是1108张,训练的是det的模型 系统环境/System Environment:windows10 版本号/Version:Paddle: PaddleOCR: release/2.5 训练结束时的显示的训练结果 [2022/08/04 15:14:42] ppocr INFO: epoch: [1200/1200], global_step: 265160, lr: 0.001000, loss: 0.139509, loss_shrink_maps: 0.065475, loss_threshold_maps: 0.063840, loss_binary_maps: 0.013063, avg_reader_cost: 0.26215 s, avg_batch_cost:...
我是win11 C++部署的CPU版,预测的时候使用--char_list_file报错,请问这种问题该怎么处理呢?谢谢!
你好,V3 的繁体中文识别模型,不再适配“竖排文字”的识别。而繁字体模型大多应用于竖排情况,比如古籍的识别等等。 在5月发布时曾说尽快更新一版,请问到现在有做相关更新吗?谢谢
报错如下: A/Paddle-Lite: [F 8/ 9 10:30:58.539 ...20/lite/Paddle-Lite/lite/core/program.cc:356 RuntimeProgram] Check failed: (kernels.size() > 0): 0!>0 Error: This model is not supported, because kernel for 'io_copy' is not supported by Paddle-Lite. A/libc:...
关于单字的识别
ppocr的识别模型是否支持对单字的识别呢?效果会比基于文本行的识别效果好吗?
paddle_inference提供32位版本的吗,因为32位系统上用,谢谢
我参照paddleOCR的deploy下的cpp_infer推理代码,在使用TensorRT来加速ch_PP-OCRv3_rec模型时出现了一个错误 错误信息如下: InvalidArgumentError: TRT runtime input shape of x is invalid. Expect runtime input shape to be within min/max input shape configured in SetTRTDynamicShapeInfo(),but got runtime input shape = [6,...
请提供下述完整信息以便快速定位问题/Please provide the following information to quickly locate the problem - 系统环境/System Environment: - 版本号/Version:Paddle: PaddleOCR: 问题相关组件/Related components: - 运行指令/Command Code: - 完整报错/Complete Error Message:
在自建数据集上(~3000张)上finetune识别模型,因为label里没有空格,把use_space_char设为false了,调整了学习率。 训练过程正常收敛,训练后 ppocr INFO: best metric, acc: 0.9619047390022681, norm_edit_dis: 0.9958383091069015, fps: 2630.607981984834, best_epoch: 373 但使用infer_rec.py发现识别结果中有大量多余字符。 data:image/s3,"s3://crabby-images/14094/140946f64a7d0f4ce1aecd18c01d58c088220176" alt="image" 请问是否有配置不正确之处或是存在参数不对齐吗? 另外对于识别部分的finetune来说,数据量要达到多少比较合适? - 系统环境/System Environment:linux - 版本号/Version:Paddle: PaddleOCR:release/2.5 - 训练配置文件 ` Global: debug: false...
layoutxlm 的ser 和re 模型 能不能像ocr 识别模型那样 从训练模型转换为推理模型? 或者能不能 paddleslim 压缩什么的?