MinerU icon indicating copy to clipboard operation
MinerU copied to clipboard

OCR会导致文本识别不全

Open FHhui opened this issue 1 year ago • 2 comments

Description of the bug | 错误描述

OCR会导致文本识别不全,可能是因为一个span一个span进行ocr识别的原因,如果换成整张图片进行识别的话会出现阅读顺序问题。

How to reproduce the bug | 如何复现

印刷体双列24-25.pdf

Operating system | 操作系统

Linux

Python version | Python 版本

3.10

Software version | 软件版本 (magic-pdf --version)

0.9.x

Device mode | 设备模式

cuda

FHhui avatar Nov 26 '24 02:11 FHhui

我这边测试没有发现文本不全和阅读顺序的问题,您升下0.10再试试呢?

myhloli avatar Nov 26 '24 02:11 myhloli

好的我试一下

FHhui avatar Nov 26 '24 02:11 FHhui

重构图、表与描述性文本的匹配逻辑,大幅提升 caption 和 footnote 与图表的匹配准确率,并将描述性文本的丢失率降至接近0 可以问一下这部分的逻辑在哪里么,感谢

------------------ 原始邮件 ------------------ 发件人: "opendatalab/MinerU" @.>; 发送时间: 2024年11月26日(星期二) 上午10:44 @.>; @.@.>; 主题: Re: [opendatalab/MinerU] OCR会导致文本识别不全 (Issue #1087)

我这边测试没有发现文本不全和阅读顺序的问题,您升下0.10再试试呢?

— Reply to this email directly, view it on GitHub, or unsubscribe. You are receiving this because you authored the thread.Message ID: @.***>

FHhui avatar Nov 27 '24 08:11 FHhui