PaddleOCR
PaddleOCR copied to clipboard
PaddlceOCR-VL对备注内容的文本无法识别
🔎 Search before asking
- [x] I have searched the PaddleOCR Docs and found no similar bug report.
- [x] I have searched the PaddleOCR Issues and found no similar bug report.
- [x] I have searched the PaddleOCR Discussions and found no similar bug report.
🐛 Bug (问题描述)
上图均为网图。 图1发票中,最后一行是备注开头的单元格的情况下,整行都无法输出。在线版和本地部署版表现相同,且JSON也没有相关文本。(在本地使用其他最后一行首格是“备注”的发票,这一行也无法输出)。发票的备注信息很重要,应该要能显示。 但是图2发票中,最后一行第三格开始才是备注的,整行就都能显示。
此外,表格最后一行第一格是备注、第二格及之后格为空。表格下方的多行文字的第一行会不显示。
请问是否有参数控制输出阈值,或是否有完整输出的结果可供查看。此外,页码、版记、“附件”(2个字)也均不显示,也希望能设置,或查看完整输出结果。
🏃♂️ Environment (运行环境)
在线和本地PaddleOCR-VL环境。
🌰 Minimal Reproducible Example (最小可复现问题的Demo)
见问题中的图片
感谢您的反馈,我们会尽快排查此问题~
Hi,此问题是由于版面检测模型得到的表格区域过于紧凑,没有将最下方框线检测在表格区域内,导致PaddleOCR-VL-0.9b模型没有正确识别,可以尝试参考文档在预测时放大layout_unclip_ratio(如调整为1.05),增大表格检测框覆盖面积,这样即可识别到下方备注内容