PaddleOCR
PaddleOCR copied to clipboard
使用PP-DocLayout_plus-L的版面区域检测模型,发现对行间公式识别不太全
🔎 Search before asking
- [x] I have searched the PaddleOCR Docs and found no similar bug report.
- [x] I have searched the PaddleOCR Issues and found no similar bug report.
- [x] I have searched the PaddleOCR Discussions and found no similar bug report.
🐛 Bug (问题描述)
如下图所示,这个是识别结果:
🏃♂️ Environment (运行环境)
PaddleOCR 3.1.3
🌰 Minimal Reproducible Example (最小可复现问题的Demo)
传入如下如片,进行版面识别:
@liuxiaohan00 可以试试最新的精度更高的 PP-DocLayoutV2 模型 https://www.paddleocr.ai/main/version3.x/module_usage/layout_analysis.html#_4
如果还不行的话,降低一下检出阈值
@liuxiaohan00 可以试试最新的精度更高的 PP-DocLayoutV2 模型 https://www.paddleocr.ai/main/version3.x/module_usage/layout_analysis.html#_4
如果还不行的话,降低一下检出阈值
我试了新的V2模型,发现对于行间公式,它可以识别得更多,但是相对PP-DocLayout_plus-L模型,它更容易丢掉版面区域,如下图:
是否还是需要降低检出阈值,设为0.2后,会出现一些冗余的版面框,如下图,出现红色框是行内公式。
确实会有一些 corner case,不过不建议阈值太低了,会有很多误检。可以考虑用一些 tta 的测略。