pdfdeal
pdfdeal copied to clipboard
A python wrapper for the Doc2X API and comes with native PDF processing (to improve PDF recall in RAG). | Doc2X API的python封装,同时附带本地的PDF处理(提升PDF在RAG中的召回率)。
如题,网上搜到的各种开源/在线的方法很多,但是自己不太熟悉,作者大大应该会比较熟
图像渲染失败
大佬您好,麻烦问一下,使用您这个框架在fastgpt进行知识库问答的时候发现图像渲染不出来,您遇到过吗。 
Test 图文混排,doc(97-2003) [新建 Microsoft Word 文档.zip](https://github.com/user-attachments/files/16076921/Microsoft.Word.zip) 多级(每个文件夹内还含有多个子文件夹)文件夹批量输入doc格式文件