MinerU
MinerU copied to clipboard
英文单词之间空格丢失
Description of the bug | 错误描述
cpu上英文显示正常有空格,但是4090上没有空格是成串的。同时两个方式在处理同一篇pdf的时候,有同一个公式都解析成了感叹号的乱码(在这一页上的解析时间明显长于其他页码)我可以提供对应的pdf供验证。 _lwq_origin.pdf
How to reproduce the bug | 如何复现
所有的操作都是按照文档进行
Operating system | 操作系统
Linux
Python version | Python 版本
3.11
Software version | 软件版本 (magic-pdf --version)
0.9.x
Device mode | 设备模式
cpu