DocGeoNet
DocGeoNet copied to clipboard
OCR指标存在一些diff
作者您好:
我们所使用的矫正图均为github上贴的,但是我们评测的OCR指标与paper中的指标存在一些diff,我们的环境是mac os。
这是我们的tesseract以及pytesseract版本:


这是我们复线的指标:

非常感谢您的工作,希望能得到您的解答!
您好,谢谢你对我们工作的关注,以及感谢您提供的数据~!
关于这个问题,您可以参考一下DocTr的这个issue。 Windows,Linux,Mac三个版本测出来的性能都略有不同,这是正常的。 对于我们的DocTr、DocScanner、DocGeoNet,我们都是在windows10下测试的。
为了这个领域的长期健康发展,我们也建议您可以在paper里注明你们自己的测试环境。 OCR性能对比,我觉得只要环境一致,对比的图像一致,我觉得没什么问题。
祝好~
好的,非常感谢您的解答!
还有一个问题,作者可以分享一下数据集 DIR300的矫正图吗?期待得到您的回复~
好的,我们最近两天会更新repo~