PaddleOCR icon indicating copy to clipboard operation
PaddleOCR copied to clipboard

PPStructureV3在Nvidia显卡下表格识别上下颠倒

Open adamzhg opened this issue 3 months ago • 5 comments

🔎 Search before asking

  • [x] I have searched the PaddleOCR Docs and found no similar bug report.
  • [x] I have searched the PaddleOCR Issues and found no similar bug report.
  • [x] I have searched the PaddleOCR Discussions and found no similar bug report.

🐛 Bug (问题描述)

使用PPStructureV3在英伟达GPU卡上推断一个表格,表格内容上下颠倒,在海光DCU上没有这个问题。 1、pipline的yaml文件中如果将table中ocr的配置项use_textline_orientation设为False,则表格识别结果文字识别大面积错误。打开这个选项文字识别不再出错,但是识别内容上下颠倒 2、在海光DCU上没有这个问题 3、paddle3.x试了几个组合(paddleocr、paddlex),都有这个问题

🏃‍♂️ Environment (运行环境)

OS:ubuntu22.04 paddleocr 3.2.0 paddlepaddle-gpu 3.1.0 paddlex 3.2.1 cuda:12.9

🌰 Minimal Reproducible Example (最小可复现问题的Demo)

出错的图片:

Image

识别结果: 上面的【计量单位...】和下面的【接收单位经办人...】上下颠倒了

adamzhg avatar Sep 08 '25 08:09 adamzhg

我也遇到了这种情况了,同样是表格内容上下颠倒

fysbl12138 avatar Sep 11 '25 08:09 fysbl12138

当我对图片进行了阈值分割后则会出现这种情况,如果将原图片放上去就不会出现这种情况

fysbl12138 avatar Sep 11 '25 08:09 fysbl12138

感谢反馈!我们会测试该问题,当前的表格识别模型确实对于一些边界情况不够鲁棒。

我们最近发布了 PaddleOCR-VL,在表格识别方面表现非常优秀,欢迎体验使用:

HuggingFace AI Studio ModelScope

TingquanGao avatar Oct 18 '25 17:10 TingquanGao

@TingquanGao ,请问paddleocr-vl现在是否支持国产GPU了,比如海光的GPU?

adamzhg avatar Nov 03 '25 10:11 adamzhg

@adamzhg 关于国产化GPU,我们正在高优测试和支持中。后续有结论后会更新,感谢关注!

TingquanGao avatar Nov 06 '25 06:11 TingquanGao