MinerU 如何获得每个字的坐标

在使用ocr的时候我看获取到的坐标一般都是一句话的坐标位置，怎么能够改为ocr按字来识别，这样就能够在json文件中得到整个pdf中全部字的坐标了。

Aug 02 '24 02:08 2257396011

ocr的最小识别单元是一行，也就是以line为单位，没办法精确到单字坐标定位

The minimum recognition unit for OCR is a line, meaning it operates on a line-by-line basis, and cannot precisely locate the coordinates of individual characters.

Aug 02 '24 02:08 myhloli

ocr的最小识别单元是一行，能够清晰以线为单位，没有精确到单字坐标定位

OCR的最小识别单位是行，也就是说它是逐行进行操作的，无法精确定位单个字符的坐标。那请问如何能够获取每个字的坐标呢，如果不适用ocr方式

Aug 02 '24 02:08 2257396011

使用pymupdf 获取页面文字信息，在char级别可以获取每个字符的坐标定位，具体的可以去看pymupdf的文档

Aug 02 '24 02:08 myhloli

使用pymupdf获取页面文字信息，在字符级别可以获取每个字符的坐标定位，具体的可以查看pymupdf的文档

请问项目中负责控制fitz库使用什么级别进行字符提取的位置在哪呀，没找到这部分内容

Aug 02 '24 05:08 2257396011

使用pymupdf获取页面文字信息，在字符级别可以获取每个字符的坐标定位，具体的可以查看pymupdf的文档

请问项目中负责控制fitz库使用什么级别进行字符提取的位置在哪呀，没找到这部分内容

https://github.com/opendatalab/MinerU/blob/37925f36d9f35d213c8217710e9ab12ace801a8b/magic_pdf/pdf_parse_union_core.py#L44

Aug 02 '24 06:08 myhloli