MinerU
MinerU copied to clipboard
表格中的特殊文字识别错误
Description of the bug | 错误描述
表格中的½这样的文字 识别错误
How to reproduce the bug | 如何复现
解析这个即可
Operating system | 操作系统
No response
Python version | Python 版本
No response
Software version | 软件版本 (magic-pdf --version)
No response
Device mode | 设备模式
No response
这是ocr的问题,ocr里压根就没这个1/2的词,可以交给公式识别MFD,如果公式识别检测不出是公式,那就没办法了,也可以标注数据微调,不过我没试过,比较麻烦。