PaddleX icon indicating copy to clipboard operation
PaddleX copied to clipboard

fix: 修复TableRecognitionPipelineV2中rec_texts和rec_scores长度不一致的问题

Open scyyh11 opened this issue 1 month ago • 1 comments

问题描述: 当OCR文本框跨越多个表格单元格需要拆分时,split_ocr_bboxes_by_table_cells方法只更新了rec_texts列表,但没有同步更新rec_scores列表,导致两者长度不一致。

修复内容:

  • 在split_ocr_bboxes_by_table_cells方法中添加对rec_scores的处理
  • 拆分OCR框时,为每个拆分后的框提取并保存对应的置信度分数
  • 未拆分时,保留原始置信度分数
  • 确保rec_texts和rec_scores始终保持相同长度

修复文件:

  • paddlex/inference/pipelines/table_recognition/pipeline_v2.py

Fixes: https://github.com/PaddlePaddle/PaddleOCR/issues/17051

scyyh11 avatar Nov 12 '25 06:11 scyyh11

Thanks for your contribution!

paddle-bot[bot] avatar Nov 12 '25 06:11 paddle-bot[bot]