FHGreatZ
FHGreatZ
### Description of the bug | 错误描述 ### How to reproduce the bug | 如何复现 [《中国药典》2020年版 一部0912-69.pdf](https://github.com/user-attachments/files/17808453/2020.0912-69.pdf) ### Operating system | 操作系统 Linux ### Python version | Python 版本 3.10...
### Description of the bug | 错误描述 OCR会导致文本识别不全,可能是因为一个span一个span进行ocr识别的原因,如果换成整张图片进行识别的话会出现阅读顺序问题。 ### How to reproduce the bug | 如何复现 [印刷体双列24-25.pdf](https://github.com/user-attachments/files/17911880/24-25.pdf) ### Operating system | 操作系统 Linux ### Python version | Python 版本 3.10...
