PPstructure-V3解析PDF报core dumped
🔎 Search before asking
- [x] I have searched the PaddleOCR Docs and found no similar bug report.
- [x] I have searched the PaddleOCR Issues and found no similar bug report.
- [x] I have searched the PaddleOCR Discussions and found no similar bug report.
🐛 Bug (问题描述)
使用示例代码报错:
from paddleocr import PPStructureV3
pipeline = PPStructureV3()
# ocr = PPStructureV3(use_doc_orientation_classify=True) # 通过 use_doc_orientation_classify 指定是否使用文档方向分类模型
# ocr = PPStructureV3(use_doc_unwarping=True) # 通过 use_doc_unwarping 指定是否使用文本图像矫正模块
# ocr = PPStructureV3(use_textline_orientation=True) # 通过 use_textline_orientation 指定是否使用文本行方向分类模型
# ocr = PPStructureV3(device="cpu") # 通过 device 指定模型推理时使用 GPU
output = pipeline.predict("./xxxx.pdf")
for res in output:
res.print() ## 打印预测的结构化输出
res.save_to_json(save_path="output") ## 保存当前图像的结构化json结果
res.save_to_markdown(save_path="output") ## 保存当前图像的markdown格式的结果
报错如下:
--------------------------------------
C++ Traceback (most recent call last):
--------------------------------------
0 phi::OneDNNContextThreadLocals::Body::~Body()
1 phi::OneDNNContext::Impl::ResetBlobMap(void*)
----------------------
Error Message Summary:
----------------------
FatalError: `Process abort signal` is detected by the operating system.
[TimeInfo: *** Aborted at 1748252073 (unix time) try "date -d @1748252073" if you are using GNU date ***]
[SignalInfo: *** SIGABRT (@0x1a6c6) received by PID 108230 (TID 0x7f95dfd5c740) from PID 108230 ***]
Aborted (core dumped)
🏃♂️ Environment (运行环境)
paddleocr-3.0.0
OS: Linux autodl-container-9cd04aa11e-ff54b7c4 5.15.0-25-generic #25-Ubuntu SMP Wed Mar 30 15:54:22 UTC 2022 x86_64 x86_64 x86_64 GNU/Linux
Cuda compilation tools, release 11.8, V11.8.89
🌰 Minimal Reproducible Example (最小可复现问题的Demo)
from paddleocr import PPStructureV3
pipeline = PPStructureV3()
# ocr = PPStructureV3(use_doc_orientation_classify=True) # 通过 use_doc_orientation_classify 指定是否使用文档方向分类模型
# ocr = PPStructureV3(use_doc_unwarping=True) # 通过 use_doc_unwarping 指定是否使用文本图像矫正模块
# ocr = PPStructureV3(use_textline_orientation=True) # 通过 use_textline_orientation 指定是否使用文本行方向分类模型
# ocr = PPStructureV3(device="cpu") # 通过 device 指定模型推理时使用 GPU
output = pipeline.predict("./xxxx.pdf")
for res in output:
res.print() ## 打印预测的结构化输出
res.save_to_json(save_path="output") ## 保存当前图像的结构化json结果
res.save_to_markdown(save_path="output") ## 保存当前图像的markdown格式的结果
请问解决了吗。我运行OCR模型也是这样。
确认一下,是否是使用的最新的官方Docker呢,建议尝试升级使用最新的官方镜像进行测试哈
确认一下,是否是使用的最新的官方Docker呢,建议尝试升级使用最新的官方镜像进行测试哈
您好,我在文档中看到的是pip安装的方式,请问哪里有docker的说明么
使用PaddlePaddle官方镜像哈:https://www.paddlepaddle.org.cn/
同问
您好,该问题我们正在排查解决,已知结论是在PaddlePaddle3.0.0最新官方镜像上可以避免该问题,其他环境上的具体成因相关同学正在定位中
我也是这个问题
我用CUDA11.8的官方镜像也报这个错误是为什么?
我用CUDA11.8的官方镜像也报这个错误是为什么?
刚下载了 11.8 试一下
我用CUDA11.8的官方镜像也报这个错误是为什么?
刚下载了 11.8 试一下
可以了吗?
我用CUDA11.8的官方镜像也报这个错误是为什么?
刚下载了 11.8 试一下
可以了吗?
不行,还是错误,我上周用还没问题,啥都没变化,就报这个错,就装了下 paddlemix
这个问题我们的开发人员正在加紧定位哈,有结论会及时同步大家
这个问题我们的开发人员正在加紧定位哈,有结论会及时同步大家
CPU docker镜像遇到同样问题。解析单页pdf,内存会发生泄漏,随后报此错误。
该问题已经在3.0.1版本上得到了修复,建议大家尝试执行pip install paddleocr==3.0.1后再次测试哈
The issue has no response for a long time and will be closed. You can reopen or new another issue if are still confused.
From Bot