FastGPT icon indicating copy to clipboard operation
FastGPT copied to clipboard

期待接入olmOCR的pdf解析能力

Open adogshz opened this issue 10 months ago • 1 comments

例行检查

  • [x] 我已确认目前没有类似 features
  • [x] 我已确认我已升级到最新版本
  • [x] 我已完整查看过项目 README,已确定现有版本无法满足需求
  • [x] 我理解并愿意跟进此 features,协助测试和提供反馈
  • [x] 我理解并认可上述内容,并理解项目维护者精力有限,不遵循规则的 features 可能会被无视或直接关闭

功能描述 olmOCR开源项目,是目前我测试过最优秀的ocr解析项目之一,我测试下的文档解析效果比marker好不少。https://github.com/allenai/olmocr

应用场景 任何的pdf需要解析的场景,包括但不限于,知识库向量化,附件pdf内容提取等等

相关示例 目前只能通过开源项目提供的web页面进行手动导入然后手动导出,期待fastgpt项目组加入to list,感谢为盼!

adogshz avatar Mar 02 '25 00:03 adogshz

fastGPT提供了一个接口,CUSTOM_READ_FILE_URL,自己写个api就可以直接接入

RipperTs avatar Mar 03 '25 08:03 RipperTs