Langchain-Chatchat
Langchain-Chatchat copied to clipboard
使用线上模式不部署开源大模型的方式无法命中知识库
知识库文件上传以及向量化正常
但是通过知识库问答无法命中上传的文档
请问可能是什么原因呢
🤖
你好,@1097886344!很高兴再次看到你的提问。希望这次我们也能一起找到解决办法。
您的问题可能有几个可能的原因,但是没有具体的错误信息或日志,很难确定具体的原因。以下是一些可能性:
-
文档可能没有在向量存储中正确索引。这可能是由于文档上传过程或向量化过程中的错误。您可以通过查看
api.upload_kb_docs和api.update_kb_docs函数的返回值来检查这一点。 -
搜索功能可能无法正常工作。这可能是由于搜索算法或搜索参数中的错误。您可以通过查看
api.search_kb_docs函数的返回值来检查这一点。 -
文档可能不包含正在搜索的关键词。这可能是由于文档不包含相关信息或搜索关键词与文档不相关。您可以通过手动检查文档和搜索关键词来检查这一点。
-
可能存在会话状态问题。会话状态用于存储选定的知识库和选定的文档。如果会话状态存在问题,可能会导致文档未被正确选择或知识库未被正确设置。您可以通过查看
st.session_state["selected_kb_name"]和st.session_state["selected_kb_info"]的值来检查这一点。 -
可能存在文档加载器或文本分割器问题。文档加载器用于将文档加载到系统中,文本分割器用于将文本分割成向量化的块。如果这两者中有任何一个存在问题,可能会导致文档未被正确加载或分割。您可以通过查看
doc_details["document_loader"]和doc_details["text_splitter"]的值来检查这一点。
没有更多的信息,很难提供更具体的答案。如果您能提供更多关于问题的详细信息,如错误信息或日志,将更容易诊断问题。
关于文档上传和向量化的具体过程,您可以参考 server/knowledge_base/kb_service/base.py 文件中的相关代码。
如果您有任何其他问题或需要进一步的帮助,请随时告诉我。
Sources
- 使用法律文件民法典作为知识库,问模型民法典第三条是什么,知识库无法有效检索到第三条
- webui_pages/knowledge_base/knowledge_base.py
- server/knowledge_base/kb_service/base.py
About Dosu
This response is meant to be useful and save you time. It is not meant to be a precise solution, but rather a starting point for your own research.
Help me be more useful! Please leave a 👍 if this is helpful and 👎 if it is irrelevant.
If you want to continue the conversation, start your reply with @dosu-bot.
遇到了同样的问题 表现类似
webui上显示是有正常检索到相关信息的 终端上也无报错
你这个搜索出来的东西有问题吧,怎么那么多特殊符号,检查一下是否根你问题有没有关系