[Question]: 对于内嵌图片的pdf文件，pdf_parser没有处理图片的逻辑导致不能生成base_parser里extract_images_from_chunk函数所需要的img tag？

Open lovepeace-max opened this issue 3 months ago • 1 comments

其他

您好，我在看代码的时候，看到对于内嵌图片的pdf文件，pdf_parser有针对table的处理逻辑，但是没有针对图片处理逻辑，导致不能生成base_parser里extract_images_from_chunk函数所需要的img tag？

No response

macOS

No response

No response

Sep 25 '25 02:09 lovepeace-max

对，我们还没有对pdf的图片进行处理，非常欢迎提pr一起优化

Oct 21 '25 12:10 begoniezhao

[Question]: 对于内嵌图片的pdf文件，pdf_parser没有处理图片的逻辑导致不能生成base_parser里extract_images_from_chunk函数所需要的*img* tag？