PSENet 合并文本框

如何合并pse给出的文本框？如何合并图中的文本框，请给我一些建议，🙏。

Aug 15 '19 08:08 luckydog5

我觉得从标注上把他们标注为一行，然后重新训练网络可能会比较好。从图里面的结果看来，这是word level的，然后您这边需要line level的标注。这是两种不同级别的标注方案。

Aug 21 '19 09:08 whai362

每个bbox的中心点向y轴投影可以分行行内再排个序就行了

Sep 21 '19 10:09 xdker

@xdker 我这个是两栏式的，如果投影的话，左右两栏的文本会被连在一起，可以通过设置一个阈值分开左右两栏的文本，但是很难找到一个阈值覆盖所有的两栏式的文本。

Sep 23 '19 03:09 luckydog5

文本框未合并的效果 img (2)

合并文本框之后的效果，水平框距离多远需要合并，根据阈值操作 test (2)

Oct 14 '19 02:10 chen849157649

请问一下你是怎样实现矩形框合并的 @chen849157649

Oct 14 '19 10:10 mayidu

请问一下你是怎样实现矩形框合并的 @chen849157649

@mayidu ,点击https://github.com/xiaomaxiao/PSENET/blob/master/predict.py#L64，这个项目中写了文本框合并操作。你参考看看

Oct 16 '19 02:10 chen849157649

感谢！

Oct 17 '19 00:10 mayidu

@chen849157649 大神你好，你发的那个合并框的链接过期啦，能否再发一个，想了解一下怎么做的

Oct 17 '19 06:10 jiangzz1628

@chen849157649 大神你好，你发的那个合并框的链接过期啦，能否再发一个，想了解一下怎么做的

@jiangzz1628 复制链接到浏览器再打开

Oct 17 '19 07:10 chen849157649

那个PSENET合并的是水平框，我比较想知道那些带角度的框怎么合并的？比如两个同一角度的文本行，检测两个框却是一个水平一个倾斜，这种有思路么？

Oct 31 '19 03:10 Lanme

那个PSENET合并的是水平框，我比较想知道那些带角度的框怎么合并的？比如两个同一角度的文本行，检测两个框却是一个水平一个倾斜，这种有思路么？

github上有个table-ocr的项目，里面有根据斜率合并的版本https://github.com/chineseocr/table-ocr

Apr 22 '20 05:04 interestingzhuo

def draw_bbox(bboxs,img):
    bboxs_res = []
    for bbox in bboxs:
        bbox = np.reshape(bbox,(4,2))
        cv2.drawContours(img, [bbox],-1, (0, 255, 0), 2)
        bboxs_res.append(bbox)
    return bboxs_res, img

 box = self.detector.predict(img_path) #作者模型的输出
  img = cv2.imread(img_path)
  bboxs_res, box_img = draw_bbox(box['bboxes'], img)

May 16 '22 15:05 HCMY

PSENet PSENet copied to clipboard

合并文本框

PSENet
PSENet copied to clipboard