MinerU icon indicating copy to clipboard operation
MinerU copied to clipboard

表格中的特殊文字识别错误

Open jinzhaoqiang opened this issue 7 months ago • 2 comments

Description of the bug | 错误描述

Image 表格中的½这样的文字 识别错误

How to reproduce the bug | 如何复现

Image 解析这个即可

Operating system | 操作系统

No response

Python version | Python 版本

No response

Software version | 软件版本 (magic-pdf --version)

No response

Device mode | 设备模式

No response

jinzhaoqiang avatar Apr 11 '25 02:04 jinzhaoqiang

Image

jinzhaoqiang avatar Apr 11 '25 02:04 jinzhaoqiang

这是ocr的问题,ocr里压根就没这个1/2的词,可以交给公式识别MFD,如果公式识别检测不出是公式,那就没办法了,也可以标注数据微调,不过我没试过,比较麻烦。

zzk2021 avatar Apr 15 '25 07:04 zzk2021