DaiHaohao

Results 3 issues of DaiHaohao

### Description of the bug | 错误描述 cpu上英文显示正常有空格,但是4090上没有空格是成串的。同时两个方式在处理同一篇pdf的时候,有同一个公式都解析成了感叹号的乱码(在这一页上的解析时间明显长于其他页码)我可以提供对应的pdf供验证。 [_lwq_origin.pdf](https://github.com/user-attachments/files/18058558/_lwq_origin.pdf) ### How to reproduce the bug | 如何复现 所有的操作都是按照文档进行 ### Operating system | 操作系统 Linux ### Python version | Python 版本...

bug

因为有的时候除了文本内容以外,其他格式的内容都有解析失败的风险,尽管目前已经非常小了。所以我想要只提取pdf中的文本内容,同时其他格式的内容根据定位从pdf中截取出来

enhancement