PaddleOCR icon indicating copy to clipboard operation
PaddleOCR copied to clipboard

使用PP-DocLayout_plus-L的版面区域检测模型,发现对行间公式识别不太全

Open liuxiaohan00 opened this issue 2 months ago • 3 comments

🔎 Search before asking

  • [x] I have searched the PaddleOCR Docs and found no similar bug report.
  • [x] I have searched the PaddleOCR Issues and found no similar bug report.
  • [x] I have searched the PaddleOCR Discussions and found no similar bug report.

🐛 Bug (问题描述)

如下图所示,这个是识别结果:

Image 段落里面有部分公式没有识别出来,如 Image 有什么办法可以解决吗

🏃‍♂️ Environment (运行环境)

PaddleOCR 3.1.3

🌰 Minimal Reproducible Example (最小可复现问题的Demo)

传入如下如片,进行版面识别:

Image

liuxiaohan00 avatar Oct 10 '25 07:10 liuxiaohan00

@liuxiaohan00 可以试试最新的精度更高的 PP-DocLayoutV2 模型 https://www.paddleocr.ai/main/version3.x/module_usage/layout_analysis.html#_4

如果还不行的话,降低一下检出阈值

leo-q8 avatar Oct 20 '25 06:10 leo-q8

@liuxiaohan00 可以试试最新的精度更高的 PP-DocLayoutV2 模型 https://www.paddleocr.ai/main/version3.x/module_usage/layout_analysis.html#_4

如果还不行的话,降低一下检出阈值

我试了新的V2模型,发现对于行间公式,它可以识别得更多,但是相对PP-DocLayout_plus-L模型,它更容易丢掉版面区域,如下图:

Image

是否还是需要降低检出阈值,设为0.2后,会出现一些冗余的版面框,如下图,出现红色框是行内公式。

Image

liuxiaohan00 avatar Oct 25 '25 09:10 liuxiaohan00

确实会有一些 corner case,不过不建议阈值太低了,会有很多误检。可以考虑用一些 tta 的测略。

leo-q8 avatar Oct 27 '25 02:10 leo-q8