pearocr_issue icon indicating copy to clipboard operation
pearocr_issue copied to clipboard

两页并排的文件能基本正确识别但导出txt文件时文字出现乱序

Open tonyyet opened this issue 3 years ago • 2 comments

bug重现步骤:

  1. 上传图片,我用的示例图片是这个: https://a.uguu.se/kyWVfmGz.jpg

  2. 使用 PearOCR 完成文字识别

  3. 选择“纯文本方式显示”

完成步骤2的时候,我们看到软件识别出来的文字基本是准确的,其所处位置于原文档基本一致,可以正常阅读。到了步骤3的时候,我们看到右侧显示出来的OCR结果的txt版本,则变成了乱序,基本无法正常阅读。

我找了很多OCR软件,想用OCR把我阅读的一些图书资料分享给视障朋友,他们所使用的读屏软件基本只能读纯文本文件,很希望看到 PearOCR 能够在纯文本输出方面有所改良。

感谢开发者!

tonyyet avatar Oct 12 '21 15:10 tonyyet

感谢你对pearocr的关注,目前纯文本输出确实有些问题,这个问题会在下个版本得到改善

PearOCR avatar Oct 13 '21 08:10 PearOCR

把图片分成2个啊

lj1998008 avatar Oct 14 '21 00:10 lj1998008