load remote model ch_PP_OCR_v4
Description of the bug | 错误描述
我已经在下载好了模型权重文件,并使用文字版pdf进行正常的测试。 当我使用一个扫描版pdf进行测试时,系统在总向网络端请求PP_OCR模型,然而我的环境是一个完全离线的环境。
How to reproduce the bug | 如何复现
使用扫描版pdf,通过命令行进行测试
Operating system | 操作系统
Linux
Python version | Python 版本
3.11
Software version | 软件版本 (magic-pdf --version)
0.6.x
Device mode | 设备模式
cuda
paddle的模型是要在线下载的,或者你可以找一台联网的机器,下载好paddle的模型再拷贝到你离线部署的那台机器里
paddle的模型是要在线下载的,或者你可以找一台联网的机器,下载好paddle的模型再拷贝到你离线部署的那台机器里
我下载的对应的包,并尝试将他放在提示的路径下,但系统仍然会联网进行下载,请问我该将他放在哪里才会生效
一般是用户目录的.paddleocr目录下 另外可能需要在/lib/python3.10/site-packages/paddleocr/tools/infer/utility.py:158 中根据这个方法中需要的路径在paddleocr初始化的时候传一下模型路径的参数
一般是用户目录的.paddleocr目录下 另外可能需要在/lib/python3.10/site-packages/paddleocr/tools/infer/utility.py:158 中根据这个方法中需要的路径在paddleocr初始化的时候传一下模型路径的参数
我的错误如上图,我将提示的包下载并放置在了对应的位置中,但他仍然会报上图一样的问题
另外可能需要在/lib/python3.10/site-packages/paddleocr/tools/infer/utility.py:158 中根据这个方法中需要的路径在paddleocr初始化的时候传一下模型路径的参数
可能需要在paddleocr初始化的时候指定一下本地模型路径
另外可能需要在/lib/python3.10/site-packages/paddleocr/tools/infer/utility.py:158 中根据这个方法中需要的路径在paddleocr初始化的时候传一下模型路径的参数
可能需要在paddleocr初始化的时候指定一下本地模型路径
请问该如何去指定,我使用的是命令行调用的方式
需要修改代码中的 https://github.com/opendatalab/MinerU/blob/c0ee70d52505535f0dac3b16b5924d5d19f1f48a/magic_pdf/model/pdf_extract_kit.py#L142 来指定模型路径,命令行不支持这个操作。
需要修改代码中的
https://github.com/opendatalab/MinerU/blob/c0ee70d52505535f0dac3b16b5924d5d19f1f48a/magic_pdf/model/pdf_extract_kit.py#L142
来指定模型路径,命令行不支持这个操作。
那在离线环境下,我该如何来实现对扫描版pdf的处理
@myhloli 什么情况下会触发下载这个模型呢?我解析纯英文的pdf好像也会触发
@myhloli 什么情况下会触发下载这个模型呢?我解析纯英文的pdf好像也会触发
处理的这篇文档是扫描版的情况下。
@myhloli 我本地做上load from cache了会报这个错。。
@myhloli 我本地做上load from cache了会报这个错。。
tar包应该解压?onnx这个参数是必须的?
@myhloli 我本地做上load from cache了会报这个错。。
你这个报错似乎是缺失了oonxruntime这个依赖包,你是否有安装?
@myhloli 确实需要把这个true去掉
magic_pdf/model/pdf_extract_kit.py
@Thirty502 看下maybe_download的实现,应该可以解决。我加了54han行跑起来了
paddleocr/ppocr/utils/network.py
但是跑得卡住了,这个问题应该解决了
@myhloli 运行卡住了,红框里的内容需要显式在代码里加开关么?
卡这十几分钟了:
@myhloli 运行卡住了,红框里的内容需要显式在代码里加开关么?
卡这十几分钟了:
https://github.com/opendatalab/MinerU/blob/master/docs/README_Ubuntu_CUDA_Acceleration_zh_CN.md
按教程来,不需要显式开关,paddle-gpu装好之后自动开启ocr加速的
你这个卡住的话和ocr加速应该关系不大,可能是初始化的地方改的不太对导致的。
经过测试,将对应的模型下载后,需要解压在相应的位置,系统仍然能够较好的运行
经过测试,将对应的模型下载后,需要解压在相应的位置,系统仍然能够较好的运行
看来还是需要解压,直接复制tar包是不行的





