hiroi-sora comments

Results 389 comments of


hiroi-sora

一个自定义快捷键的Bug

新解决方案： https://github.com/hiroi-sora/Umi-OCR/issues/402

@CMG-CEO 这确实是个奇怪的问题，以前从没有在Rapid引擎插件上见过类似 `[WinError 193] %1 不是有效的 Win32 应用程序` 的报错。请尝试： 1. 打开目录 `UmiOCR-data\plugins\win7_x64_RapidOCR-json` 2. 右键 → 在终端中打开 3. 输入 `./RapidOCR-json.exe --rec=rec_ch_PP-OCRv4_infer.onnx` ，回车正常情况下，应该输出 `OCR init completed.` 。请查看是否正常？

Rapid_v2.0.1.7z 版本识别弹窗报错

那就更奇怪了，引擎组件本身是正常的，但是python调用的时候却抛出跟系统兼容性有关的报错。目前只能认为是由于你的系统的某种特殊环境，引起的罕见bug。我的知识面暂时无法对此做出判断，抱歉。未来如果有新进展会通知你。如果你的CPU兼容Paddle引擎的话（不是奔腾、赛扬、凌动处理器），可以尝试下[Paddle版本](https://github.com/hiroi-sora/Umi-OCR/releases/latest)是否正常。

大佬，打包之后exe报错

我这边测试，打包是正常的哦。请确保： 1. 未打包时，直接在工程目录中使用 Umi-OCR.exe 运行，是否正常？ 2. 是否使用脚本 release.py 进行打包？ 3. 打包后，程序目录中是否存在 `UmiOCR-data\py_src\imports\plugin_i18n.py` ？

大佬，打包之后exe报错

本项目使用了`嵌入式python运行环境`的开发和发布方式，因此不适用于传统的 pyinstaller 打包。请使用本项目中附带的一键打包脚本 release.py 。

希望能加入对数学公式识别的支持

对于 [Pix2Text引擎插件](https://github.com/hiroi-sora/Umi-OCR/issues/254) 来说，本身支持文本+公式混合种类图片的识别，所以目前没有“单独识别数学公式”的功能。之后如果有性能更好的、专门针对数学公式的识别引擎，我会考虑专门为数学公式识别设计一个功能标签页。

哪位大佬开发一下HTTP功能

你是想部署到自己服务器的话，不妨了解一下隔壁的： [TrWebOCR](https://github.com/alisen39/TrWebOCR) [RapidOCR/ocrweb](https://github.com/RapidAI/RapidOCR/tree/main/ocrweb) [RapidOCRServer](https://github.com/Physton/RapidOCRServer)

功能建议：关于竖版文字从右往左识别

嗯，前端支持整理竖排文本的结果。引擎简中v3库的竖排确实不太好，繁中v2库相对好一点。只能希望paddle出些简中竖排适配更好的库，或者以后我有空训练一组。

识别书籍目录图片可以优化

如果是单单“书籍目录图片”这种任务，适用面比较窄，我可能暂时不会专门针对这种需求做优化。输出为“排版相同的纯文字”也不太容易实现。不过正计划开发PDF识别/还原排版功能，对这种书籍目录也能输出为排版相同的PDF/word富文本文件。

识别书籍目录图片可以优化

> 在软件的设置里面改一下，输出排版选择代码段，就可以实现跟原文目录一样的排版了。对于最新版本，则是： **排版解析方案** → `单栏-保留缩进`。 ![image](https://github.com/hiroi-sora/Umi-OCR/assets/56373419/a6e37b66-57dc-40d2-a646-932c2654760a)