PaddleOCR 使用PP-DocLayout_plus-L的版面区域检测模型，发现对行间公式识别不太全

如下图所示，这个是识别结果：

段落里面有部分公式没有识别出来，如

有什么办法可以解决吗

PaddleOCR 3.1.3

传入如下如片，进行版面识别：

Oct 10 '25 07:10 liuxiaohan00

@liuxiaohan00 可以试试最新的精度更高的 PP-DocLayoutV2 模型 https://www.paddleocr.ai/main/version3.x/module_usage/layout_analysis.html#_4

如果还不行的话，降低一下检出阈值

Oct 20 '25 06:10 leo-q8

@liuxiaohan00 可以试试最新的精度更高的 PP-DocLayoutV2 模型 https://www.paddleocr.ai/main/version3.x/module_usage/layout_analysis.html#_4

如果还不行的话，降低一下检出阈值

我试了新的V2模型，发现对于行间公式，它可以识别得更多，但是相对PP-DocLayout_plus-L模型，它更容易丢掉版面区域，如下图：

是否还是需要降低检出阈值，设为0.2后，会出现一些冗余的版面框，如下图，出现红色框是行内公式。

Oct 25 '25 09:10 liuxiaohan00

确实会有一些 corner case，不过不建议阈值太低了，会有很多误检。可以考虑用一些 tta 的测略。

Oct 27 '25 02:10 leo-q8