WeKnora icon indicating copy to clipboard operation
WeKnora copied to clipboard

[Question]: 对于内嵌图片的pdf文件,pdf_parser没有处理图片的逻辑导致不能生成base_parser里extract_images_from_chunk函数所需要的*img* tag?

Open lovepeace-max opened this issue 3 months ago • 1 comments

问题类别

其他

问题描述

您好,我在看代码的时候,看到对于内嵌图片的pdf文件,pdf_parser有针对table的处理逻辑,但是没有针对图片处理逻辑,导致不能生成base_parser里extract_images_from_chunk函数所需要的img tag?

背景信息

No response

操作系统

macOS

其他环境信息

No response

相关日志


已查找的资源

No response

确认事项

  • [x] 我已经搜索了现有的 issues 和文档
  • [x] 我已经提供了足够的信息来帮助理解问题

lovepeace-max avatar Sep 25 '25 02:09 lovepeace-max

对,我们还没有对pdf的图片进行处理,非常欢迎提pr一起优化

begoniezhao avatar Oct 21 '25 12:10 begoniezhao