MinerU icon indicating copy to clipboard operation
MinerU copied to clipboard

询问11月22日更新的具体能力和实现方式

Open ignore1999 opened this issue 3 months ago • 0 comments

Discussed in https://github.com/opendatalab/MinerU/discussions/1108

Originally posted by ignore1999 November 27, 2024 请问11月22日更新的“混合OCR文本提取能力”具体是指什么,是如何实现的?

2024/11/22 0.10.0发布,通过引入混合OCR文本提取能力,
在公式密集、span区域不规范、部分文本使用图像表现等复杂文本分布场景下获得解析效果的显著提升
同时具备文本模式内容提取准确、速度更快与OCR模式span/line区域识别更准的双重优势
```</div>

ignore1999 avatar Dec 03 '24 02:12 ignore1999