PaddleOCR-json icon indicating copy to clipboard operation
PaddleOCR-json copied to clipboard

Linux环境下无法找到PaddleOCR-json.exe

Open Eric-Lin-HKUSTGZ opened this issue 10 months ago • 3 comments

你好,我按照https://github.com/hiroi-sora/PaddleOCR-json/blob/release/1.4.1/cpp/README-linux.md中的步骤在Linux环境中配置成功了,想通过python api中的demo3测试一下,但一直找不PaddleOCR-json.exe,请问如何解决,谢谢

Eric-Lin-HKUSTGZ avatar Feb 23 '25 13:02 Eric-Lin-HKUSTGZ

借楼

v1.4.1 具备“大幅优化内存占用:峰值由 2.5GB 降至约 1.5GB 。”这个优化吗,我的生产环境(版本是三个月之前的分支:https://github.com/Gavin1937/PaddleOCR-json/tree/autoclean) (配置2核 4G),最近客户上传了一个文字内容丰富的大图出现了内存100%导致服务器崩溃的情况,计划回来更新一下,请问使用最新版本可以解决我的问题吗

zclcz avatar Feb 24 '25 02:02 zclcz

@Eric-Lin-HKUSTGZ

你好,我按照https://github.com/hiroi-sora/PaddleOCR-json/blob/release/1.4.1/cpp/README-linux.md中的步骤在Linux环境中配置成功了,想通过python api中的demo3测试一下,但一直找不PaddleOCR-json.exe,请问如何解决,谢谢

您好,这种情况是因为所有的python api demo都没有指定引擎的路径,您可以修改一下demo文件来指定到您的引擎。

就是这一行,向GetOcrApi方法中传入路径即可 https://github.com/hiroi-sora/PaddleOCR-json/blob/f1c8addb77433f458a17ceed8db5c5650e547918/api/python/demo3.py#L15

如果您是自己编译了引擎的话,可以使用这个路径:PaddleOCR-json/cpp/tools/linux_run.sh 如果您用的是发行版的引擎,可以使用这个路径:PaddleOCR-json/run.sh

Gavin1937 avatar Feb 26 '25 13:02 Gavin1937

@zclcz

借楼

v1.4.1 具备“大幅优化内存占用:峰值由 2.5GB 降至约 1.5GB 。”这个优化吗,我的生产环境(版本是三个月之前的分支:https://github.com/Gavin1937/PaddleOCR-json/tree/autoclean) (配置2核 4G),最近客户上传了一个文字内容丰富的大图出现了内存100%导致服务器崩溃的情况,计划回来更新一下,请问使用最新版本可以解决我的问题吗

v1.4.1 有这个优化,它已经跟进了 PP-OCR 最新推理库,内存占用的优化是由PP-OCR方面实现的,比起我的这个workaround更好。 详情请看这里 还有 这里

您可以尝试升级到最新的release分支再尝试复现一下这个崩溃的问题。

不过引擎的计算量与内存占用必然会随着输入图片的分辨率、内容量一起增加。如果升级最新版无法解决这个问题的话,可以考虑在前端加一些图片限制。或者把图片分块ocr?当然,您也可以客制化PPOCR官方库来更进一步的优化引擎调用。

Gavin1937 avatar Feb 26 '25 13:02 Gavin1937