DocGeoNet icon indicating copy to clipboard operation
DocGeoNet copied to clipboard

OCR指标存在一些diff

Open dbylynn opened this issue 2 years ago • 3 comments

作者您好:

我们所使用的矫正图均为github上贴的,但是我们评测的OCR指标与paper中的指标存在一些diff,我们的环境是mac os。

这是我们的tesseract以及pytesseract版本:

image image
      这是我们复线的指标:
     
image

非常感谢您的工作,希望能得到您的解答!

dbylynn avatar Nov 21 '22 09:11 dbylynn

您好,谢谢你对我们工作的关注,以及感谢您提供的数据~!

关于这个问题,您可以参考一下DocTr的这个issue。 Windows,Linux,Mac三个版本测出来的性能都略有不同,这是正常的。 对于我们的DocTr、DocScanner、DocGeoNet,我们都是在windows10下测试的。

为了这个领域的长期健康发展,我们也建议您可以在paper里注明你们自己的测试环境。 OCR性能对比,我觉得只要环境一致,对比的图像一致,我觉得没什么问题。

祝好~

fh2019ustc avatar Nov 21 '22 14:11 fh2019ustc

好的,非常感谢您的解答!

还有一个问题,作者可以分享一下数据集 DIR300的矫正图吗?期待得到您的回复~

dbylynn avatar Nov 24 '22 13:11 dbylynn

好的,我们最近两天会更新repo~

fh2019ustc avatar Nov 24 '22 13:11 fh2019ustc