FastGPT icon indicating copy to clipboard operation
FastGPT copied to clipboard

PDF-Marker支持的版本太低,预计什么时间升级到 v1.6.1 以上呢

Open Lanny2020 opened this issue 9 months ago • 4 comments

例行检查

  • [x] 我已确认目前没有类似 features
  • [x] 我已确认我已升级到最新版本
  • [x] 我已完整查看过项目 README,已确定现有版本无法满足需求
  • [x] 我理解并愿意跟进此 features,协助测试和提供反馈
  • [x] 我理解并认可上述内容,并理解项目维护者精力有限,不遵循规则的 features 可能会被无视或直接关闭

功能描述 自定义PDF解析依赖的PDF-Marker太低,目前是marker-pdf==0.3.10,我试了官方最新版本 v1.6.1,PDF解析的效果好不少。老版本解析出来有很多的垃圾标签,非常影响知识库的分段(有时分段出来的有效文字才占了10%左右,其他全部是标签)。

应用场景

相关示例

Image

Lanny2020 avatar Mar 14 '25 08:03 Lanny2020

例行检查

  • [x] 我已确认目前没有类似 features[x] 我已确认我已升级到最新版本[x] 我已完整查看过项目 README,已确定现有版本无法满足需求[x] 我理解并愿意跟进此 features,协助测试和提供反馈[x] 我理解并认可上述内容,并理解项目维护者精力有限,不遵循规则的 features 可能会被无视或直接关闭

功能描述 自定义PDF解析依赖的PDF-Marker太低,目前是marker-pdf==0.3.10,我试了官方最新版本 v1.6.1,PDF解析的效果好不少。老版本解析出来有很多的垃圾标签,非常影响知识库的分段(有时分段出来的有效文字才占了10%左右,其他全部是标签)。

应用场景

相关示例

Image

强烈支持,希望fastgpt能尽快更新对对应的mp_api

warlockedward avatar Mar 17 '25 05:03 warlockedward

强烈支持,希望fastgpt能尽快更新

hjqcn avatar Mar 18 '25 11:03 hjqcn

最新版他有点问题 https://github.com/VikParuchuri/marker/issues/593 所以目前还是1.5.5版本的

YYH211 avatar Mar 20 '25 02:03 YYH211

最新版他有点问题 VikParuchuri/marker#593 所以目前还是1.5.5版本的

1.5.5版本是在docker的image里面吗? 我看github的仓库里还是 0.3.1

yuanhuanglin avatar Mar 25 '25 05:03 yuanhuanglin