UFOyyds
UFOyyds
> 能上传一些解析过程中的日志看看具体是具体哪个步骤耗时过长吗 `(detectron2_env) C:\Users\XXXXX>magic-pdf pdf-command --pdf "pdf_path" --inside_model true 2024-08-05 14:10:24.153 | WARNING | magic_pdf.cli.magicpdf:get_model_json:312 - not found json "pdf_path".json existed 2024-08-05 14:10:24.154 | WARNING | magic_pdf.libs.config_reader:get_local_dir:64 - 'temp-output-dir' not...
> @UFOyyds 看了下你的log,一个2页的扫描版pdf,除去模型加载34秒,解析用时89秒,其中约70秒是在layout检测上,这个时间是符合预期的。使用纯cpu解析时,解析效率与cpu的核心数量和主频相关性极高。一般4核cpu单页layout时间30秒左右是正常的,8核cpu可以把这个时间缩短到15秒左右。 cpu解析方案只是为了兼容更多设备,为没有gpu设备的用户提供的一种快速体验方案,不适合在生产环境长时间和大量处理文档使用,这一点在readme中也已经做了说明。 如果需要较快的解析速度,一张大显存显卡是不可缺少的。具体显卡型号选择,可以参考 > > https://github.com/opendatalab/MinerU/blob/master/README_zh-CN_v2.md > > 中【安装前必看——软硬件环境支持说明】的表格。 感谢解答!