PaddleOCR icon indicating copy to clipboard operation
PaddleOCR copied to clipboard

PPstructure-V3解析PDF报core dumped

Open thorory opened this issue 7 months ago • 14 comments

🔎 Search before asking

  • [x] I have searched the PaddleOCR Docs and found no similar bug report.
  • [x] I have searched the PaddleOCR Issues and found no similar bug report.
  • [x] I have searched the PaddleOCR Discussions and found no similar bug report.

🐛 Bug (问题描述)

使用示例代码报错:

from paddleocr import PPStructureV3

pipeline = PPStructureV3()
# ocr = PPStructureV3(use_doc_orientation_classify=True) # 通过 use_doc_orientation_classify 指定是否使用文档方向分类模型
# ocr = PPStructureV3(use_doc_unwarping=True) # 通过 use_doc_unwarping 指定是否使用文本图像矫正模块
# ocr = PPStructureV3(use_textline_orientation=True) # 通过 use_textline_orientation 指定是否使用文本行方向分类模型
# ocr = PPStructureV3(device="cpu") # 通过 device 指定模型推理时使用 GPU
output = pipeline.predict("./xxxx.pdf")
for res in output:
    res.print() ## 打印预测的结构化输出
    res.save_to_json(save_path="output") ## 保存当前图像的结构化json结果
    res.save_to_markdown(save_path="output") ## 保存当前图像的markdown格式的结果

报错如下:

--------------------------------------
C++ Traceback (most recent call last):
--------------------------------------
0   phi::OneDNNContextThreadLocals::Body::~Body()
1   phi::OneDNNContext::Impl::ResetBlobMap(void*)

----------------------
Error Message Summary:
----------------------
FatalError: `Process abort signal` is detected by the operating system.
  [TimeInfo: *** Aborted at 1748252073 (unix time) try "date -d @1748252073" if you are using GNU date ***]
  [SignalInfo: *** SIGABRT (@0x1a6c6) received by PID 108230 (TID 0x7f95dfd5c740) from PID 108230 ***]

Aborted (core dumped)

🏃‍♂️ Environment (运行环境)

paddleocr-3.0.0

OS: Linux autodl-container-9cd04aa11e-ff54b7c4 5.15.0-25-generic #25-Ubuntu SMP Wed Mar 30 15:54:22 UTC 2022 x86_64 x86_64 x86_64 GNU/Linux

Cuda compilation tools, release 11.8, V11.8.89

🌰 Minimal Reproducible Example (最小可复现问题的Demo)

from paddleocr import PPStructureV3

pipeline = PPStructureV3()
# ocr = PPStructureV3(use_doc_orientation_classify=True) # 通过 use_doc_orientation_classify 指定是否使用文档方向分类模型
# ocr = PPStructureV3(use_doc_unwarping=True) # 通过 use_doc_unwarping 指定是否使用文本图像矫正模块
# ocr = PPStructureV3(use_textline_orientation=True) # 通过 use_textline_orientation 指定是否使用文本行方向分类模型
# ocr = PPStructureV3(device="cpu") # 通过 device 指定模型推理时使用 GPU
output = pipeline.predict("./xxxx.pdf")
for res in output:
    res.print() ## 打印预测的结构化输出
    res.save_to_json(save_path="output") ## 保存当前图像的结构化json结果
    res.save_to_markdown(save_path="output") ## 保存当前图像的markdown格式的结果

thorory avatar May 26 '25 09:05 thorory

请问解决了吗。我运行OCR模型也是这样。

Image

Tian14267 avatar May 26 '25 11:05 Tian14267

确认一下,是否是使用的最新的官方Docker呢,建议尝试升级使用最新的官方镜像进行测试哈

changdazhou avatar May 26 '25 12:05 changdazhou

确认一下,是否是使用的最新的官方Docker呢,建议尝试升级使用最新的官方镜像进行测试哈

您好,我在文档中看到的是pip安装的方式,请问哪里有docker的说明么

thorory avatar May 27 '25 08:05 thorory

使用PaddlePaddle官方镜像哈:https://www.paddlepaddle.org.cn/

changdazhou avatar May 27 '25 11:05 changdazhou

同问

IeohMingChan avatar May 28 '25 03:05 IeohMingChan

您好,该问题我们正在排查解决,已知结论是在PaddlePaddle3.0.0最新官方镜像上可以避免该问题,其他环境上的具体成因相关同学正在定位中

changdazhou avatar May 28 '25 04:05 changdazhou

我也是这个问题

ross-Hr avatar May 28 '25 05:05 ross-Hr

我用CUDA11.8的官方镜像也报这个错误是为什么?

CDragon1 avatar May 28 '25 07:05 CDragon1

我用CUDA11.8的官方镜像也报这个错误是为什么?

刚下载了 11.8 试一下

ross-Hr avatar May 28 '25 08:05 ross-Hr

我用CUDA11.8的官方镜像也报这个错误是为什么?

刚下载了 11.8 试一下

可以了吗?

CDragon1 avatar May 28 '25 08:05 CDragon1

我用CUDA11.8的官方镜像也报这个错误是为什么?

刚下载了 11.8 试一下

可以了吗?

不行,还是错误,我上周用还没问题,啥都没变化,就报这个错,就装了下 paddlemix

ross-Hr avatar May 28 '25 09:05 ross-Hr

这个问题我们的开发人员正在加紧定位哈,有结论会及时同步大家

changdazhou avatar May 28 '25 12:05 changdazhou

这个问题我们的开发人员正在加紧定位哈,有结论会及时同步大家

CPU docker镜像遇到同样问题。解析单页pdf,内存会发生泄漏,随后报此错误。

rivendell1984 avatar Jun 04 '25 01:06 rivendell1984

该问题已经在3.0.1版本上得到了修复,建议大家尝试执行pip install paddleocr==3.0.1后再次测试哈

changdazhou avatar Jun 18 '25 03:06 changdazhou

The issue has no response for a long time and will be closed. You can reopen or new another issue if are still confused.


From Bot

TingquanGao avatar Jul 19 '25 12:07 TingquanGao