MinerU
MinerU copied to clipboard
相同段落的文本识别成两个段落
Description of the bug | 错误描述
原始文本
解析后文本****
How to reproduce the bug | 如何复现
magic-pdf pdf-command --pdf agents.pdf --inside_model true --method ocr
Operating system | 操作系统
Windows
Python version | Python 版本
3.10
Software version | 软件版本 (magic-pdf --version)
0.6.x
Device mode | 设备模式
cpu
@freedom1993 please upload your pdf file
referendes has the same problem
original text
parsed text