hiroi-sora

Results 389 comments of hiroi-sora

感谢提供的信息。这是由于 [OpenCV库不支持HEIC格式](https://stackoverflow.com/questions/60951161/does-opencv-support-heic-image-format) ,所以基于OpenCV的OCR引擎无法读取该图片。暂时没有好的办法,只能用第三方软件转为标准jpg或png格式,再导入Umi。 另外,如果任意一张图片无法识别,Umi会自动将其忽略,继续后面的任务的。你是否观察到,一个图片无法识别,导致后续任务无法进行?

OK,那就是在正常设计以内。 相关: https://github.com/hiroi-sora/Umi-OCR/issues/424

> 这几张图片识别不了,你看下什么问题 你这个压缩包里5个png文件,全部都能正常识别啊 ![image](https://github.com/hiroi-sora/Umi-OCR/assets/56373419/7b043105-cb38-41d2-b803-1c9fa4760efa)

是不是上传错了,你说不行的是 jpg ,上传的是 png

还是没有上传完哦, "Uploading" 表示上传中,要等它变成链接,才是完成。

这两张图片确实不太对劲,Windows默认的图片浏览器无法打开。WPS倒是可以打开。 ![image](https://github.com/hiroi-sora/Umi-OCR/assets/56373419/07ade458-ff9b-4700-9522-2152b94b1c1b) 我用一些源信息查看工具来检查,估计这两张是嵌套文件,即外层是jpg格式的小尺寸缩略图,内层是webp或heic的完整图。对于这种非标准的文件格式,常规软件不提供支持是正常的。 你可以先批量OCR,然后将出错的图片单独收集起来,用一些支持的转换工具转为标准的jpg、png等格式,再导入OCR。

> 方便加你vx? 不好意思,不太方便交换私人联系方式。 > 同样的是这样的图片,有的可以正常识别,有的不能识别 可能对于部分文件,二进制结构符合常规标准,可以被解码。而部分文件,嵌套缩略图的形式恰好破坏了二进制结构,导致无法解码。 那就将所有图片转换格式吧。比如可以用WPS的批量转换。网上也有一些在线的免费转换服务,可以试一试。 ![image](https://github.com/hiroi-sora/Umi-OCR/assets/56373419/4ff8c923-887e-4f01-9657-1fdfb3996046)

> 这样可以人工关注下结果是否完美 加了个功能,如果存在识别失败的图片,则任务完成后会弹窗提醒。 左栏的文件列表中,**状态** 标为 `×` 的就是识别失败的图片。 ![image](https://github.com/hiroi-sora/Umi-OCR/assets/56373419/6369e83b-c206-4dd0-96a1-e197bf39a53a)

另外,Umi中是有两套图片解码机制。一套是OCR引擎中的**OpenCV**,它的兼容性较弱,无法解码楼上的样例图片。 另一套是QT框架的**QImage**,兼容性较强,可以成功解码样例图片,并转换为标准png等格式。 未来,Umi可能会增加一个“**批量转换图片格式**”的标签页,类似简化版的格式工厂,将各种图片转换为标准格式。此外,也许还能提供 批量图片压缩、图片裁切等实用功能。 ![image](https://github.com/hiroi-sora/Umi-OCR/assets/56373419/74befae8-7c7f-4300-8b38-078401dd7b84)

> 各种不同尺寸的图片,都要忽略右下角的水印,请问要如何设置忽略区域呢? 忽略区域的判定是以左上角为坐标系原点的。对于不同尺寸图片,目前无法准确定位到“所有图片的右下角”。 如果各种图片的尺寸差别不大,并且文字区域离水印的距离较远,那么可以将忽略区域画大一点,确保包裹住最小、最大的图片的右下角。 如果图片尺寸差别较大,那么有一种曲线救国的方法:先批量将所有图片旋转180°,将右下角“挪到”左上角。然后在Umi中划选左上角作为忽略区域,并且标签页设置中勾选 **纠正文本方向** 以便能识别倒置的文字。