2257396011

Results 8 issues of 2257396011

在使用ocr的时候我看获取到的坐标一般都是一句话的坐标位置,怎么能够改为ocr按字来识别,这样就能够在json文件中得到整个pdf中全部字的坐标了。

enhancement

### Description of the bug | 错误描述 使用表格识别功能后报错: Traceback (most recent call last): File "D:\wzh\MinerU-master\demo\magic_pdf_parse_main.py", line 136, in pdf_parse_main(pdf_path) │ └ 'D:/wzh/1.pdf' └ > File "D:\wzh\MinerU-master\demo\magic_pdf_parse_main.py", line 121, in pdf_parse_main...

bug

我在magic_model.py中找到了提取ocr文字的代码,但是我看pdf_parse_union_core.py中只用了get_all_spans来获取ocr提取的文字,然后用txt方式的话会替换一下,ocr方式的话直接用这个的返回值不需要替换。但是一直没有用到get_ocr_text这个函数,所以想问一下使用ocr提取的代码是哪个。 ![屏幕截图 2024-08-07 105453](https://github.com/user-attachments/assets/eca33c72-3e0f-4e29-a40b-faaef6904168)

enhancement

### Description of the bug | 错误描述 [08/09 08:35:21 d2.checkpoint.detection_checkpoint]: [DetectionCheckpointer] Loading from /home/founder/MinerU-master/MinerU-master/PDF-Extract-Kit/Layout/model_final.pth ... [08/09 08:35:21 fvcore.common.checkpoint]: [Checkpointer] Loading from /home/founder/MinerU-master/MinerU-master/PDF-Extract-Kit/Layout/model_final.pth ... 2024-08-09 08:35:23.885 | INFO | magic_pdf.model.pdf_extract_kit:__init__:132 -...

bug

### Description of the bug | 错误描述 (MinerU) founder@founder:~/MinerU/MinerU-master$ python -m pip install paddlepaddle-gpu==3.0.0b1 -i https://www.paddlepaddle.org.cn/packages/stable/cu118/ Looking in indexes: https://www.paddlepaddle.org.cn/packages/stable/cu118/ Collecting paddlepaddle-gpu==3.0.0b1 Downloading https://paddle-whl.bj.bcebos.com/stable/cu118/paddlepaddle-gpu/paddlepaddle_gpu-3.0.0b1-cp310-cp310-linux_x86_64.whl (845.8 MB) ━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━ 845.8/845.8 MB 1.5...

bug

目前只能提前输入解析的方式,文件路径,是否使用表格检测,ocr等,然后再加载模型并解析。感觉可以改成先不输入任何信息,先加载好模型,然后再输入信息进行解析操作,感觉这种也方便部署和进行连续的pdf解析等操作。

enhancement

请问model.json中的poly坐标和bbox坐标两者之间有什么区别么,感觉bbox像是那种相对坐标,如果想要获取绝对坐标的话是得需要poly和bbox一起计算还是怎么样

目前我在readme中只找到了命令行运行的方式,请问在哪里可以直接使用代码运行呢?