另外可以通过设置解析方式-m txt 文本方式提取pdf中的阿拉伯文么,我跟踪程序发现,跟到magic_pdf\model\batch_analyze.py第33代码self.model = self.model_manager.get_model(ocr=True,..),不理解为什么在指定txt方法下,为什么还是会设定为ocr=True
另外可以通过设置解析方式-m txt 文本方式提取pdf中的阿拉伯文么,我跟踪程序发现,跟到magic_pdf\model\batch_analyze.py第33代码self.model = self.model_manager.get_model(ocr=True,..),不理解为什么在指定txt方法下,为什么还是会设定为ocr=True