MinerU icon indicating copy to clipboard operation
MinerU copied to clipboard

使用ocr模式运行一段时间后卡住

Open zuanzuanshao opened this issue 1 year ago • 7 comments

Description of the bug | 错误描述

image 图片上面是具体的运行信息,请问是因为内存不够才卡住吗?

How to reproduce the bug | 如何复现

magic-pdf -p 奥迪Q5混合动力技术培训.pdf -m ocr

Operating system | 操作系统

Linux

Python version | Python 版本

3.10

Software version | 软件版本 (magic-pdf --version)

0.7.x

Device mode | 设备模式

cuda

zuanzuanshao avatar Aug 19 '24 10:08 zuanzuanshao

截图能看到显存没满,内存32g的满了?

myhloli avatar Aug 19 '24 10:08 myhloli

@myhloli 这个是运行时的数据,我是在wsl里面的Ubuntu跑的。 image

zuanzuanshao avatar Aug 19 '24 10:08 zuanzuanshao

wsl的内存策略和物理机不同?

myhloli avatar Aug 19 '24 10:08 myhloli

刚查了下,没有物理机直接,多了一层。

zuanzuanshao avatar Aug 19 '24 10:08 zuanzuanshao

要不试下直接在win上跑呢,程序对windows兼容其实还不错的。

myhloli avatar Aug 19 '24 10:08 myhloli

@zuanzuanshao 不建议wsl参与大规模提取,wsl无论做任何事情卡死是常态。

drunkpig avatar Aug 19 '24 10:08 drunkpig

@myhloli @drunkpig 好的,我试试直接Windows看看。

zuanzuanshao avatar Aug 19 '24 10:08 zuanzuanshao

要不试下直接在win上跑呢,程序对windows兼容其实还不错的。 我就是在window下使用conda构建服务,模型下载到本地,调用api解析文件时就一直卡住,没有日志显示,按CTRL+C后又显示进程了,这种情况经常卡住,使用gpu模式加速也是一样。该怎么优化?还是使用docker来部署会好些?

ZXH-hu avatar Oct 13 '25 03:10 ZXH-hu