hiroi-sora comments

Results 389 comments of


hiroi-sora

无法识别HEIC编码的图片，错误码203

感谢提供的信息。这是由于 [OpenCV库不支持HEIC格式](https://stackoverflow.com/questions/60951161/does-opencv-support-heic-image-format) ，所以基于OpenCV的OCR引擎无法读取该图片。暂时没有好的办法，只能用第三方软件转为标准jpg或png格式，再导入Umi。另外，如果任意一张图片无法识别，Umi会自动将其忽略，继续后面的任务的。你是否观察到，一个图片无法识别，导致后续任务无法进行？

无法识别HEIC编码的图片，错误码203

OK，那就是在正常设计以内。相关： https://github.com/hiroi-sora/Umi-OCR/issues/424

无法识别HEIC编码的图片，错误码203

> 这几张图片识别不了，你看下什么问题你这个压缩包里5个png文件，全部都能正常识别啊 ![image](https://github.com/hiroi-sora/Umi-OCR/assets/56373419/7b043105-cb38-41d2-b803-1c9fa4760efa)

无法识别HEIC编码的图片，错误码203

是不是上传错了，你说不行的是 jpg ，上传的是 png

无法识别HEIC编码的图片，错误码203

还是没有上传完哦， "Uploading" 表示上传中，要等它变成链接，才是完成。

无法识别HEIC编码的图片，错误码203

这两张图片确实不太对劲，Windows默认的图片浏览器无法打开。WPS倒是可以打开。 ![image](https://github.com/hiroi-sora/Umi-OCR/assets/56373419/07ade458-ff9b-4700-9522-2152b94b1c1b) 我用一些源信息查看工具来检查，估计这两张是嵌套文件，即外层是jpg格式的小尺寸缩略图，内层是webp或heic的完整图。对于这种非标准的文件格式，常规软件不提供支持是正常的。你可以先批量OCR，然后将出错的图片单独收集起来，用一些支持的转换工具转为标准的jpg、png等格式，再导入OCR。

无法识别HEIC编码的图片，错误码203

> 方便加你vx？不好意思，不太方便交换私人联系方式。 > 同样的是这样的图片，有的可以正常识别，有的不能识别可能对于部分文件，二进制结构符合常规标准，可以被解码。而部分文件，嵌套缩略图的形式恰好破坏了二进制结构，导致无法解码。那就将所有图片转换格式吧。比如可以用WPS的批量转换。网上也有一些在线的免费转换服务，可以试一试。 ![image](https://github.com/hiroi-sora/Umi-OCR/assets/56373419/4ff8c923-887e-4f01-9657-1fdfb3996046)

无法识别HEIC编码的图片，错误码203

> 这样可以人工关注下结果是否完美加了个功能，如果存在识别失败的图片，则任务完成后会弹窗提醒。左栏的文件列表中，**状态** 标为 `×` 的就是识别失败的图片。 ![image](https://github.com/hiroi-sora/Umi-OCR/assets/56373419/6369e83b-c206-4dd0-96a1-e197bf39a53a)

无法识别HEIC编码的图片，错误码203

另外，Umi中是有两套图片解码机制。一套是OCR引擎中的**OpenCV**，它的兼容性较弱，无法解码楼上的样例图片。另一套是QT框架的**QImage**，兼容性较强，可以成功解码样例图片，并转换为标准png等格式。未来，Umi可能会增加一个“**批量转换图片格式**”的标签页，类似简化版的格式工厂，将各种图片转换为标准格式。此外，也许还能提供批量图片压缩、图片裁切等实用功能。 ![image](https://github.com/hiroi-sora/Umi-OCR/assets/56373419/74befae8-7c7f-4300-8b38-078401dd7b84)

无法识别HEIC编码的图片，错误码203

> 各种不同尺寸的图片，都要忽略右下角的水印，请问要如何设置忽略区域呢？忽略区域的判定是以左上角为坐标系原点的。对于不同尺寸图片，目前无法准确定位到“所有图片的右下角”。如果各种图片的尺寸差别不大，并且文字区域离水印的距离较远，那么可以将忽略区域画大一点，确保包裹住最小、最大的图片的右下角。如果图片尺寸差别较大，那么有一种曲线救国的方法：先批量将所有图片旋转180°，将右下角“挪到”左上角。然后在Umi中划选左上角作为忽略区域，并且标签页设置中勾选 **纠正文本方向** 以便能识别倒置的文字。