Langchain-Chatchat icon indicating copy to clipboard operation
Langchain-Chatchat copied to clipboard

使用线上模式不部署开源大模型的方式无法命中知识库

Open 1097886344 opened this issue 1 year ago • 2 comments

知识库文件上传以及向量化正常 image image 但是通过知识库问答无法命中上传的文档 image 请问可能是什么原因呢 image

1097886344 avatar Feb 21 '24 05:02 1097886344

🤖

你好,@1097886344!很高兴再次看到你的提问。希望这次我们也能一起找到解决办法。

您的问题可能有几个可能的原因,但是没有具体的错误信息或日志,很难确定具体的原因。以下是一些可能性:

  1. 文档可能没有在向量存储中正确索引。这可能是由于文档上传过程或向量化过程中的错误。您可以通过查看 api.upload_kb_docsapi.update_kb_docs 函数的返回值来检查这一点。

  2. 搜索功能可能无法正常工作。这可能是由于搜索算法或搜索参数中的错误。您可以通过查看 api.search_kb_docs 函数的返回值来检查这一点。

  3. 文档可能不包含正在搜索的关键词。这可能是由于文档不包含相关信息或搜索关键词与文档不相关。您可以通过手动检查文档和搜索关键词来检查这一点。

  4. 可能存在会话状态问题。会话状态用于存储选定的知识库和选定的文档。如果会话状态存在问题,可能会导致文档未被正确选择或知识库未被正确设置。您可以通过查看 st.session_state["selected_kb_name"]st.session_state["selected_kb_info"] 的值来检查这一点。

  5. 可能存在文档加载器或文本分割器问题。文档加载器用于将文档加载到系统中,文本分割器用于将文本分割成向量化的块。如果这两者中有任何一个存在问题,可能会导致文档未被正确加载或分割。您可以通过查看 doc_details["document_loader"]doc_details["text_splitter"] 的值来检查这一点。

没有更多的信息,很难提供更具体的答案。如果您能提供更多关于问题的详细信息,如错误信息或日志,将更容易诊断问题。

关于文档上传和向量化的具体过程,您可以参考 server/knowledge_base/kb_service/base.py 文件中的相关代码。

如果您有任何其他问题或需要进一步的帮助,请随时告诉我。

Sources

About Dosu

This response is meant to be useful and save you time. It is not meant to be a precise solution, but rather a starting point for your own research.

Help me be more useful! Please leave a 👍 if this is helpful and 👎 if it is irrelevant.

If you want to continue the conversation, start your reply with @dosu-bot.

dosubot[bot] avatar Feb 21 '24 05:02 dosubot[bot]

遇到了同样的问题 表现类似 image webui上显示是有正常检索到相关信息的 终端上也无报错 image

Rheron1848 avatar Feb 21 '24 06:02 Rheron1848

你这个搜索出来的东西有问题吧,怎么那么多特殊符号,检查一下是否根你问题有没有关系

zRzRzRzRzRzRzR avatar Feb 25 '24 06:02 zRzRzRzRzRzRzR