DB
DB copied to clipboard
calculate the box original width and height
在浏览issue的时候看到一个有意思的讨论 #145 很显然,适当的调整后处理的一些参数会带来更好的效果。 但是大家都没有讨论过unclip_ratio 这个参数,在原始的代码中,使用的是默认的参数1.5 但是对于不同的数据集,不同的宽高比,这个参数带来的误差还是比较大的,起码在我的数据集中是这样的。 既然新矩形的宽高是通过旧矩形通过固定过程裁剪出来的,我们就可以尝试计算二次方程来通过新的宽高求解原始宽高。 我尝试了一下,效果很不错。在我的数据集上,这种自适应的宽高,将F1从88.75%提高到了90.39% 限于时间和算力,我没有在其他数据集上进行评测,但是我觉得会有不错的效果。
没有任何相关的意见吗?
感谢你的PR。本仓库主要为了复现对应的论文。由于该方法未在标准数据集上验证,暂时不计划将其并入主分支。
你说的对,我尝试了在三种公开测试集上的验证效果,都有不同程度的降低,经过分析,这里的自适应恢复对于倾斜文本的计算是存在问题的,我本人测试使用的数据集是通过标准pdf构建,所以标注结果都是标准矩形,这里的自适应恢复才会产生一个比较好的结果。 后续如果有时间我会继续尝试这种不规则多边形的恢复。
提交的代码里面是不是有个地方写错了? c = 1 - np.sqrt(0.4, 2) # shrink_ratio 0.4 这里应该是power吧?
是的,后面测试的时候发现了这个问题,在我本地做了修改,但是由于发现在公开测试集的测试效果不好,所以就没有提交改动。
是的,后面测试的时候发现了这个问题,在我本地做了修改,但是由于发现在公开测试集的测试效果不好,所以就没有提交改动。
嗯,我这边的数据上改成自适应膨胀的效果也不太好,还在分析原因呢
是的,后面测试的时候发现了这个问题,在我本地做了修改,但是由于发现在公开测试集的测试效果不好,所以就没有提交改动。
嗯,我这边的数据上改成自适应膨胀的效果也不太好,还在分析原因呢
有需要的话可以加个微信交流一下