PaddleOCR icon indicating copy to clipboard operation
PaddleOCR copied to clipboard

PaddlceOCR-VL对备注内容的文本无法识别

Open cwyalpha opened this issue 2 months ago • 2 comments

🔎 Search before asking

  • [x] I have searched the PaddleOCR Docs and found no similar bug report.
  • [x] I have searched the PaddleOCR Issues and found no similar bug report.
  • [x] I have searched the PaddleOCR Discussions and found no similar bug report.

🐛 Bug (问题描述)

Image

Image

上图均为网图。 图1发票中,最后一行是备注开头的单元格的情况下,整行都无法输出。在线版和本地部署版表现相同,且JSON也没有相关文本。(在本地使用其他最后一行首格是“备注”的发票,这一行也无法输出)。发票的备注信息很重要,应该要能显示。 但是图2发票中,最后一行第三格开始才是备注的,整行就都能显示。

此外,表格最后一行第一格是备注、第二格及之后格为空。表格下方的多行文字的第一行会不显示。

请问是否有参数控制输出阈值,或是否有完整输出的结果可供查看。此外,页码、版记、“附件”(2个字)也均不显示,也希望能设置,或查看完整输出结果。

🏃‍♂️ Environment (运行环境)

在线和本地PaddleOCR-VL环境。

🌰 Minimal Reproducible Example (最小可复现问题的Demo)

见问题中的图片

cwyalpha avatar Oct 24 '25 07:10 cwyalpha

感谢您的反馈,我们会尽快排查此问题~

changdazhou avatar Oct 24 '25 11:10 changdazhou

Hi,此问题是由于版面检测模型得到的表格区域过于紧凑,没有将最下方框线检测在表格区域内,导致PaddleOCR-VL-0.9b模型没有正确识别,可以尝试参考文档在预测时放大layout_unclip_ratio(如调整为1.05),增大表格检测框覆盖面积,这样即可识别到下方备注内容

liu-jiaxuan avatar Oct 29 '25 08:10 liu-jiaxuan