PaddleOCR
PaddleOCR copied to clipboard
SLANet 训练数据中bbox transform是不是有错误呀?
PaddleOCR release/2.6 SLANet 训练代码在 TableBoxEncode data transform 中对bbox做了归一化处理(相对于原图的尺寸) bboxes[:, 0::2] /= img_width bboxes[:, 1::2] /= img_height 后面在PaddingTableImage中对图片做了padding,导致实际训练时使用的 bbox 是相对于原图尺寸的归一化值,使用的图片是padding后的,两者存在不一致。