WeKnora
WeKnora copied to clipboard
[Question]: 对于内嵌图片的pdf文件,pdf_parser没有处理图片的逻辑导致不能生成base_parser里extract_images_from_chunk函数所需要的*img* tag?
问题类别
其他
问题描述
您好,我在看代码的时候,看到对于内嵌图片的pdf文件,pdf_parser有针对table的处理逻辑,但是没有针对图片处理逻辑,导致不能生成base_parser里extract_images_from_chunk函数所需要的img tag?
背景信息
No response
操作系统
macOS
其他环境信息
No response
相关日志
已查找的资源
No response
确认事项
- [x] 我已经搜索了现有的 issues 和文档
- [x] 我已经提供了足够的信息来帮助理解问题
对,我们还没有对pdf的图片进行处理,非常欢迎提pr一起优化