PaddleOCR-json icon indicating copy to clipboard operation
PaddleOCR-json copied to clipboard

OCR离线图片文字识别命令行windows程序,以JSON字符串形式输出结果,方便别的程序调用。提供各种语言API。由 PaddleOCR C++ 编译。

Results 16 PaddleOCR-json issues
Sort by recently updated
recently updated
newest added

![企业微信截图_17151386612515](https://github.com/hiroi-sora/PaddleOCR-json/assets/54066072/1c84528c-55d6-4022-8ad5-9f3a64db6826) const ocr = new OCR( path.join(__dirname, './PaddleOCR/PaddleOCR-json.exe'), [ /* '-port=9985', '-addr=loopback' */ ], { cwd: path.join(__dirname, './PaddleOCR/'), }, false ); let base64 = outputBuffer.toDataURL(); let imageBase64 = base64.substring(base64.indexOf(',') +...

甚至如果可以支持在运行时传递这个路径参数应该会更方便 如题,感谢作者。

自己封装了dll供java调用,为了防止每次初始化模型,所以dll暴漏了3个方法。后面也有截图 1是初始化模型返回识别对象initHandler() 2根据识别对象识别图像rec() 3关闭识别对象closeHandler() 这3个方法暴漏给java调用,在cpu版本运行良好。现在我用gpu版本编译后,直接c++掉,或者生成exe命令行掉都可以使用gpu,但是用java掉rec方法无法使用gpu,jvm会崩溃,初始化和关闭方法没问题。不知道哪里的问题,能否提供一些思路? java掉初始化handler的时候是成功,也正确返回了handler。掉rec的时候则出问题,报错如下 ![image](https://github.com/hiroi-sora/PaddleOCR-json/assets/162696111/7c38343a-4195-4a47-8e3d-d9bc77e95b16) dll中封装的3个方法 ![image](https://github.com/hiroi-sora/PaddleOCR-json/assets/162696111/52495cc1-353c-4d69-a2b9-256d05aed46f) java调用代码如下: ![image](https://github.com/hiroi-sora/PaddleOCR-json/assets/162696111/b0792883-35dd-4c74-b23f-c3b420567ee7)

原版的PaddleOCR可以识别PDF文件,能否增加对pdf文件的图片内容的识别呢?

![image](https://github.com/hiroi-sora/PaddleOCR-json/assets/119099807/1c3252a4-13b4-476d-b1c2-e478adc92d7b)

你好,目前最新的识别模型是ch_PP-OCRv4_rec_infer,但是这个工具似乎不能使用ch_PP-OCRv4_rec_infer进行识别,我将识别模型换成v4的,结果识别出来的是乱码。 ![Uploading img.png…]()

PaddleOCR-json.exe 文字识别很好用 能不能开放一个表格识别接口出来( --type=structure) paddleocr --image_dir="C:/Users/19680/Pictures/test/01.png" --type=structure --layout=false

有些场景需要识别表格,大佬能否增加表格识别的支持