DB icon indicating copy to clipboard operation
DB copied to clipboard

calculate the box original width and height

Open chencodeX opened this issue 4 years ago • 9 comments

在浏览issue的时候看到一个有意思的讨论 #145 很显然,适当的调整后处理的一些参数会带来更好的效果。 但是大家都没有讨论过unclip_ratio 这个参数,在原始的代码中,使用的是默认的参数1.5 但是对于不同的数据集,不同的宽高比,这个参数带来的误差还是比较大的,起码在我的数据集中是这样的。 既然新矩形的宽高是通过旧矩形通过固定过程裁剪出来的,我们就可以尝试计算二次方程来通过新的宽高求解原始宽高。 我尝试了一下,效果很不错。在我的数据集上,这种自适应的宽高,将F1从88.75%提高到了90.39% 限于时间和算力,我没有在其他数据集上进行评测,但是我觉得会有不错的效果。

chencodeX avatar Dec 11 '20 05:12 chencodeX

没有任何相关的意见吗?

chencodeX avatar Jan 18 '21 09:01 chencodeX

感谢你的PR。本仓库主要为了复现对应的论文。由于该方法未在标准数据集上验证,暂时不计划将其并入主分支。

MhLiao avatar Apr 27 '21 07:04 MhLiao

你说的对,我尝试了在三种公开测试集上的验证效果,都有不同程度的降低,经过分析,这里的自适应恢复对于倾斜文本的计算是存在问题的,我本人测试使用的数据集是通过标准pdf构建,所以标注结果都是标准矩形,这里的自适应恢复才会产生一个比较好的结果。 后续如果有时间我会继续尝试这种不规则多边形的恢复。

chencodeX avatar May 06 '21 09:05 chencodeX

提交的代码里面是不是有个地方写错了? c = 1 - np.sqrt(0.4, 2) # shrink_ratio 0.4 这里应该是power吧?

viviayi avatar Jun 22 '21 09:06 viviayi

是的,后面测试的时候发现了这个问题,在我本地做了修改,但是由于发现在公开测试集的测试效果不好,所以就没有提交改动。

chencodeX avatar Jun 22 '21 09:06 chencodeX

是的,后面测试的时候发现了这个问题,在我本地做了修改,但是由于发现在公开测试集的测试效果不好,所以就没有提交改动。

嗯,我这边的数据上改成自适应膨胀的效果也不太好,还在分析原因呢

viviayi avatar Jun 24 '21 09:06 viviayi

是的,后面测试的时候发现了这个问题,在我本地做了修改,但是由于发现在公开测试集的测试效果不好,所以就没有提交改动。

嗯,我这边的数据上改成自适应膨胀的效果也不太好,还在分析原因呢

有需要的话可以加个微信交流一下

chencodeX avatar Jun 25 '21 06:06 chencodeX