Umi-OCR icon indicating copy to clipboard operation
Umi-OCR copied to clipboard

【FAQ】 常见问题 / Frequently Asked Questions

Open hiroi-sora opened this issue 3 months ago • 12 comments

Translate to English

Umi-OCR 常见问题

这个Issue列举一些本项目常见的问题及解答。

提出新Issue之前,请确保在您已经读过此篇内容或搜索过其他Issue,确保问题没有重复。

目录:

Windows7 常见问题

Windows7用户特别注意:Win7已是过时、官方放弃维护的系统。本项目依赖的某些第三方库可能在此系统上存在兼容性问题。我们只能确保对靠后的Win7版本,尽量让所有功能可用。
强烈建议Windows7用户将最新的系统补丁、驱动、VC运行库 等安装完整,以确保最佳兼容性。

使用源码时的问题

hiroi-sora avatar Mar 28 '24 13:03 hiroi-sora

PaddleOCR-json 应用程序无法正常启动(0xc0000142)

发生条件:

  • CPU不支持AVX指令集

修复方法:

换用 PaddleOCR 之外的插件或软件版本。比如:

hiroi-sora avatar Mar 28 '24 13:03 hiroi-sora

某种语言识别准确率低

(特别是简中、英语以外的语言,如繁中、日文等)

如果 Umi-OCR 在识别中没有报错,那么这类问题与 Umi 本身无关。

Umi 支持多种离线OCR引擎(详见 插件仓库),它们均为 开源项目 。对于大众语言如 简体中文、英语,开源项目也可以达到接近商业服务的性能和准度。但受限于 模型训练成本 ,开源项目往往无法投入太多资源来训练 较小众语言 的模型。

因此,类似 繁中、日文、韩文、音标、特殊符号 等语言/字符,在复杂图片中准确率较低,是目前难以避免的。

Umi-OCR 未来计划允许接入在线OCR服务。如果对准确率有较高的要求,未来可以使用百度、腾讯等公司提供的在线收费OCR服务。

同时,如果发现有某款开源引擎在某些领域的识别效果优于现有模型,也欢迎开发者适配,或者提出适配请求。详见插件仓库。

hiroi-sora avatar Mar 28 '24 13:03 hiroi-sora

表格识别 / 图片翻译

目前,作者正在筹备一次较大的重构,重新设计软件底层的插件系统,以便支持更丰富的插件,为 表格识别图片翻译、更完善的Latex识别、跨平台支持 等功能做铺垫。

受限于作者的业余时间、精力等限制,难以在短期内完成这项工作,还请耐心等待。

hiroi-sora avatar Mar 29 '24 11:03 hiroi-sora

Linux 与 MacOS 支持

跨平台的支持已在本项目的未来计划之中。在开发之初, Umi-OCR v2 就为跨平台预留了代码接口,依赖的第三方组件也选用了支持跨平台的方案。目前,还需等待插件系统重构完成。

受限于作者的业余时间、精力等限制,难以在短期内完成这项工作,还请耐心等待。

第三方 方案:

目前支持 Linux 与 MacOS 的开源OCR软件:

hiroi-sora avatar Apr 01 '24 13:04 hiroi-sora

GPU加速

此功能在长线计划内。目前由开发者 qwedc001 负责主要工作,进展见 RapidOCR-json-gpu/releases

但是,GPU加速依赖的CUDA环境调配较为复杂,设备兼容性较差。对于非开发者的普通用户而言,安装、配置、调试的门槛较高。我们正在研究如何让普通人能更轻松地使用它。

欢迎更多愿意帮忙测试或者提供贡献的用户来推进GPU计划,您需要有一块支持CUDA的Nvidia显卡。如有兴趣,请浏览 RapidOCR-json-gpu 项目,并在该仓库的Issues中交流。

hiroi-sora avatar Apr 09 '24 03:04 hiroi-sora

启动软件时,错误弹窗:

Failed to create OpenGL context for format QSurfaceFormat(version 2.0, options QFlagsQSurfaceFormat:FormatOption0,depthBufferSize24 redBufferSize -1,greenBufferSize -1,blueBufferSize -1, alphaBufferSize 8, stencilBufferSize 8, samples -1, swapBehavior QSurfaceFormat:DoubleBuffer, swaplnterval 1, colorSpace QSurfaceFormat:DefaultColorSpace, profile QSurfaceFormat:NoProfile).
This is most likely caused by not having the necessary graphics drivers installed.

Install a driver providing OpenGL 2.0 or higher, or, if this is not possible, make sure the ANGLE Open GL ES 2.0 emulation libraries (libEGL.dll, libGLESv2.dll and d3dcompiler_*.dll) are available in the application executable's directory or in a location listedinPATH.

可能的发生条件:

  • win7 早期版本,或更老的windows系统
  • 显卡驱动不全,或显卡(包括核显)型号太老
  • 部分虚拟机环境

修复方法:

下载: opengl32sw_x64.zip

解压,将其中的两个dll文件放置于 UmiOCR-data/site-packages/PySide2/

hiroi-sora avatar Apr 09 '24 03:04 hiroi-sora

弹出黑框控制台窗口,【错误】Umi-OCR Error 找不到指定的程序 OSError

对于 v2.1.1 及以上版本,启动软件时弹出一个黑色控制台窗口,显示类似如下的报错信息。 对于 v2.1.1 以下版本,启动软件时什么反应都没有,但是在cmd中打开软件时,显示类似如下的报错信息。

【错误】 Umi-OCR Error: Failed to initialize running environment!

OSError: [WinError 127] 找不到指定的程序。: '...\\UmiOCR-data\\site-packages\\shiboken2'

raise ImportError<'this platform is not supported: <>'.format  
importError: DLL Load failed while importing _ctypes: 参数错误

image image

可能的发生条件:

  • win7早期版本,缺少系统补丁(尤其是KB2533623
  • 其他原因,导致 Python 3.8 无法在该系统中运行。

修复方法:

推荐方法:使用系统检查更新(控制面板 → 系统和安全 → Windows Update → 检查更新),安装所有更新。

另一种方法:单独下载安装 KB2533623补丁Windows6.1-KB2533623-x64.msu ) ,重启系统即可。不过,微软的 官方渠道 已经关闭了该补丁的下载链接,您可能只能从第三方网站下载补丁,请务必注意安全。

hiroi-sora avatar Apr 09 '24 03:04 hiroi-sora

保存PDF时 “已停止工作”

文档识别,能识别出文字,能保存为txt等文件。但如果选择保存为双层可搜索PDF,则最后导出文件时弹窗报错:

Umi-OCR.exe 已停止工作

查看问题详细信息:

问题事件名称:BEX64
故障模块名称:ucrtbase.DLL
故障模块版本:10.0.10240.16390
异常偏移:00000000064399
异常代码:c0000417

可能的发生条件:

win7早期版本,缺少系统补丁(尤其是 KB4534310KB3042058

修复方法:

注意!由于 KB4534310 依赖前置补丁,因此 不能 单独下载安装该补丁。

您必须使用系统检查更新(控制面板 → 系统和安全 → Windows Update → 检查更新),安装所有缺失的更新,直到这个项目安装完毕:

2020-01 适用于基于 x64 的系统的 Windows 7 月度安全质量汇总 (KB4534310)

温馨提示,如果自动升级的过程中出现 80092004 的安装错误,实测 这个做法 有效。

如下图,直到安装了这些更新,就能解决PDF无法保存的问题。

image

hiroi-sora avatar Apr 09 '24 03:04 hiroi-sora

丢失api-ms-win-crt-runtime-l1-1-0.dll

打开软件时,依次弹出以下两个错误弹窗:

Umi-OCR.exe-系统错误 无法启动此程序,因为计算机中丢失 api-ms-win-crt-runtime-l1-1-0.dll 。尝试重新安装该程序以解决此问题。

image

ERROR Cannot find Py_Main() in: ...\Umi-OCR\UmioCR-data\runtime\python3.dll

image

可能的发生条件:

缺少VC运行库

修复方法:

安装 VC运行库(点击下载) 。随后如果出现不同的报错,请参考本贴的其它条目解决。

hiroi-sora avatar Apr 29 '24 10:04 hiroi-sora