chatdoc
chatdoc copied to clipboard
你好,请问这个项目怎么解析pdf的呀
请问这个项目怎么解析pdf的,我说的比较简单,大体上是使用pypdf识别字符和表格然后用rag做的吗
https://github.com/daodao97/chatdoc/blob/master/server/doc_util.py#L79 你看这个 基本是靠PyPDF2 这个包的 PdfReader