hiroi-sora

Results 389 comments of hiroi-sora

新解决方案: https://github.com/hiroi-sora/Umi-OCR/issues/402

@CMG-CEO 这确实是个奇怪的问题,以前从没有在Rapid引擎插件上见过类似 `[WinError 193] %1 不是有效的 Win32 应用程序` 的报错。 请尝试: 1. 打开目录 `UmiOCR-data\plugins\win7_x64_RapidOCR-json` 2. 右键 → 在终端中打开 3. 输入 `./RapidOCR-json.exe --rec=rec_ch_PP-OCRv4_infer.onnx` ,回车 正常情况下,应该输出 `OCR init completed.` 。请查看是否正常?

那就更奇怪了,引擎组件本身是正常的,但是python调用的时候却抛出跟系统兼容性有关的报错。 目前只能认为是由于你的系统的某种特殊环境,引起的罕见bug。我的知识面暂时无法对此做出判断,抱歉。未来如果有新进展会通知你。 如果你的CPU兼容Paddle引擎的话(不是奔腾、赛扬、凌动处理器),可以尝试下[Paddle版本](https://github.com/hiroi-sora/Umi-OCR/releases/latest)是否正常。

我这边测试,打包是正常的哦。 请确保: 1. 未打包时,直接在工程目录中使用 Umi-OCR.exe 运行,是否正常? 2. 是否使用脚本 release.py 进行打包? 3. 打包后,程序目录中是否存在 `UmiOCR-data\py_src\imports\plugin_i18n.py` ?

本项目使用了`嵌入式python运行环境`的开发和发布方式,因此不适用于传统的 pyinstaller 打包。 请使用本项目中附带的一键打包脚本 release.py 。

对于 [Pix2Text引擎插件](https://github.com/hiroi-sora/Umi-OCR/issues/254) 来说,本身支持文本+公式 混合种类图片的识别,所以目前没有“单独识别数学公式”的功能。 之后如果有性能更好的、专门针对数学公式的识别引擎,我会考虑专门为数学公式识别 设计一个功能标签页。

你是想部署到自己服务器的话,不妨了解一下隔壁的: [TrWebOCR](https://github.com/alisen39/TrWebOCR) [RapidOCR/ocrweb](https://github.com/RapidAI/RapidOCR/tree/main/ocrweb) [RapidOCRServer](https://github.com/Physton/RapidOCRServer)

嗯,前端支持整理竖排文本的结果。引擎简中v3库的竖排确实不太好,繁中v2库相对好一点。只能希望paddle出些简中竖排适配更好的库,或者以后我有空训练一组。

如果是单单“书籍目录图片”这种任务,适用面比较窄,我可能暂时不会专门针对这种需求做优化。输出为“排版相同的纯文字”也不太容易实现。 不过正计划开发PDF识别/还原排版功能,对这种书籍目录也能输出为排版相同的PDF/word富文本文件。

> 在软件的设置里面改一下,输出排版选择代码段,就可以实现跟原文目录一样的排版了。 对于最新版本,则是: **排版解析方案** → `单栏-保留缩进`。 ![image](https://github.com/hiroi-sora/Umi-OCR/assets/56373419/a6e37b66-57dc-40d2-a646-932c2654760a)