Linux环境下无法找到PaddleOCR-json.exe
你好,我按照https://github.com/hiroi-sora/PaddleOCR-json/blob/release/1.4.1/cpp/README-linux.md中的步骤在Linux环境中配置成功了,想通过python api中的demo3测试一下,但一直找不PaddleOCR-json.exe,请问如何解决,谢谢
借楼
v1.4.1 具备“大幅优化内存占用:峰值由 2.5GB 降至约 1.5GB 。”这个优化吗,我的生产环境(版本是三个月之前的分支:https://github.com/Gavin1937/PaddleOCR-json/tree/autoclean) (配置2核 4G),最近客户上传了一个文字内容丰富的大图出现了内存100%导致服务器崩溃的情况,计划回来更新一下,请问使用最新版本可以解决我的问题吗
@Eric-Lin-HKUSTGZ
你好,我按照https://github.com/hiroi-sora/PaddleOCR-json/blob/release/1.4.1/cpp/README-linux.md中的步骤在Linux环境中配置成功了,想通过python api中的demo3测试一下,但一直找不PaddleOCR-json.exe,请问如何解决,谢谢
您好,这种情况是因为所有的python api demo都没有指定引擎的路径,您可以修改一下demo文件来指定到您的引擎。
就是这一行,向GetOcrApi方法中传入路径即可
https://github.com/hiroi-sora/PaddleOCR-json/blob/f1c8addb77433f458a17ceed8db5c5650e547918/api/python/demo3.py#L15
如果您是自己编译了引擎的话,可以使用这个路径:PaddleOCR-json/cpp/tools/linux_run.sh
如果您用的是发行版的引擎,可以使用这个路径:PaddleOCR-json/run.sh
@zclcz
借楼
v1.4.1 具备“大幅优化内存占用:峰值由 2.5GB 降至约 1.5GB 。”这个优化吗,我的生产环境(版本是三个月之前的分支:https://github.com/Gavin1937/PaddleOCR-json/tree/autoclean) (配置2核 4G),最近客户上传了一个文字内容丰富的大图出现了内存100%导致服务器崩溃的情况,计划回来更新一下,请问使用最新版本可以解决我的问题吗
v1.4.1 有这个优化,它已经跟进了 PP-OCR 最新推理库,内存占用的优化是由PP-OCR方面实现的,比起我的这个workaround更好。 详情请看这里 还有 这里
您可以尝试升级到最新的release分支再尝试复现一下这个崩溃的问题。
不过引擎的计算量与内存占用必然会随着输入图片的分辨率、内容量一起增加。如果升级最新版无法解决这个问题的话,可以考虑在前端加一些图片限制。或者把图片分块ocr?当然,您也可以客制化PPOCR官方库来更进一步的优化引擎调用。