MinerU icon indicating copy to clipboard operation
MinerU copied to clipboard

pdf有旋转属性时可视化框位置不准确

Open Yue-Rain opened this issue 1 year ago • 3 comments

Description of the bug | 错误描述

image 按照教程来跑一个示例,同时将is_table_recog_enable设置为True,其他的使用默认参数,layout检测框不对,应该是横向的。

How to reproduce the bug | 如何复现

{
    "bucket_info":{
        "bucket-name-1":["ak", "sk", "endpoint"],
        "bucket-name-2":["ak", "sk", "endpoint"]
    },
    "models-dir":"/path/to/models",
    "device-mode":"cpu",
    "table-config": {
        "model": "TableMaster",
        "is_table_recog_enable": true,
        "max_time": 400
    }
}

magic-pdf.template.json配置 guicheng_origin.pdf

Operating system | 操作系统

Linux

Python version | Python 版本

3.10

Software version | 软件版本 (magic-pdf --version)

0.8.x

Device mode | 设备模式

cuda

Yue-Rain avatar Oct 09 '24 06:10 Yue-Rain

这个是因为pdf当前页存在一个90度旋转的情况,绘制检测框的时候没有根据旋转角度进行位置修正,但是应该不影响当前页面的文本提取。

myhloli avatar Oct 09 '24 09:10 myhloli

这个是因为pdf当前页存在一个90度旋转的情况,绘制检测框的时候没有根据旋转角度进行位置修正,但是应该不影响当前页面的文本提取。

那请问有什么办法进行位置修正吗?这样子不知道是否准确

aodingpeng avatar Nov 05 '24 13:11 aodingpeng

这个是因为pdf当前页存在一个90度旋转的情况,绘制检测框的时候没有根据旋转角度进行位置修正,但是应该不影响当前页面的文本提取。

那请问有什么办法进行位置修正吗?这样子不知道是否准确

可以尝试重新实现一下画框的代码,先将pdf页面根据旋转角度渲染成正常角度的图片,再直接在图片上画框,目前mineru中直接使用了pumupdf的线框绘制逻辑,测试过一些调整方案,但是收益甚微,问题可能出在pymupdf库上,因为旋转的文档并不多,而且可视化只是辅助验证手段,并不影响文本的提取功能,所以目前没有计划针对这个问题进行修复。

myhloli avatar Nov 05 '24 17:11 myhloli

fixed over 2.1.6

myhloli avatar Aug 26 '25 11:08 myhloli