Langchain-Chatchat icon indicating copy to clipboard operation
Langchain-Chatchat copied to clipboard

功能询问

Open yukaijun2001 opened this issue 1 year ago • 4 comments

1.输出的文档可以一次性输入多个pdf吗 2.chunk分块功能可以修改成自定义的吗

yukaijun2001 avatar Mar 31 '25 08:03 yukaijun2001

Hey @JavaWhites! I'm here to assist you with any questions or issues you may have. Feel free to ask me anything!

  1. 是的,Langchain-Chatchat 支持一次性输入多个 PDF 文件。可以通过 upload_temp_docs 函数上传多个文件,该函数允许同时上传和处理多个文件 [1]

  2. 是的,Langchain-Chatchat 允许自定义 chunk 分块功能。可以通过 UploadTempDocsParam 类中的 chunk_sizechunk_overlap 参数进行自定义。这些参数分别指定知识库中单段文本的最大长度和相邻文本的重合长度 [2][3].

To continue talking to Dosu, mention @dosu.


Help Dosu learn! Give it feedback: Great Response | Irrelevant Answer | Incorrect Sources | Too Verbose | Hallucination | Bug Report | Other

dosubot[bot] avatar Mar 31 '25 08:03 dosubot[bot]

chunk分块功能全部重写,使用最新的agentic chunking,这个可以实现吗

于凯俊 @.***

 

------------------ 原始邮件 ------------------ 发件人: "chatchat-space/Langchain-Chatchat" @.>; 发送时间: 2025年3月31日(星期一) 下午4:52 @.>; @.@.>; 主题: Re: [chatchat-space/Langchain-Chatchat] 功能询问 (Issue #5294)

Hey @JavaWhites! I'm here to assist you with any questions or issues you may have. Feel free to ask me anything!

是的,Langchain-Chatchat 支持一次性输入多个 PDF 文件。可以通过 upload_temp_docs 函数上传多个文件,该函数允许同时上传和处理多个文件 [1]。

是的,Langchain-Chatchat 允许自定义 chunk 分块功能。可以通过 UploadTempDocsParam 类中的 chunk_size 和 chunk_overlap 参数进行自定义。这些参数分别指定知识库中单段文本的最大长度和相邻文本的重合长度 [2][3].

To continue talking to Dosu, mention @dosu.

Help Dosu learn! Give it feedback: Great Response | Irrelevant Answer | Incorrect Sources | Too Verbose | Hallucination | Bug Report | Other

— Reply to this email directly, view it on GitHub, or unsubscribe. You are receiving this because you were mentioned.Message ID: @.***> dosubot[bot] left a comment (chatchat-space/Langchain-Chatchat#5294)

Hey @JavaWhites! I'm here to assist you with any questions or issues you may have. Feel free to ask me anything!

是的,Langchain-Chatchat 支持一次性输入多个 PDF 文件。可以通过 upload_temp_docs 函数上传多个文件,该函数允许同时上传和处理多个文件 [1]。

是的,Langchain-Chatchat 允许自定义 chunk 分块功能。可以通过 UploadTempDocsParam 类中的 chunk_size 和 chunk_overlap 参数进行自定义。这些参数分别指定知识库中单段文本的最大长度和相邻文本的重合长度 [2][3].

To continue talking to Dosu, mention @dosu.

Help Dosu learn! Give it feedback: Great Response | Irrelevant Answer | Incorrect Sources | Too Verbose | Hallucination | Bug Report | Other

— Reply to this email directly, view it on GitHub, or unsubscribe. You are receiving this because you were mentioned.Message ID: @.***>

yukaijun2001 avatar Mar 31 '25 08:03 yukaijun2001

要在 Langchain-Chatchat 中实现最新的 agentic chunking 方法,您可能需要重写现有的分块功能。目前的实现使用 MapReduceDocumentsChain 进行分块和总结 [1]。虽然现有的实现允许一定程度的自定义(例如通过 chunk_sizechunk_overlap 参数),但要完全实现 agentic chunking,可能需要更深入的代码修改。

目前没有找到关于 agentic chunking 的具体实现或支持的信息,因此您可能需要自行设计和实现这一功能。可以考虑创建一个新的类或方法来替代现有的 SummaryAdapter,并根据 agentic chunking 的需求进行调整。

如果您有关于 agentic chunking 的具体需求或设计,可以进一步讨论如何在代码中实现这些功能。

To continue talking to Dosu, mention @dosu.


Help Dosu learn! Give it feedback: Great Response | Irrelevant Answer | Incorrect Sources | Too Verbose | Hallucination | Bug Report | Other

dosubot[bot] avatar Mar 31 '25 08:03 dosubot[bot]

请问我修改了Langchain-Chatchat/libs/chatchat-server/chatchat/server/knowledge_base/utils.py,想查看分块后的各块内容,但是打印并没有生效,请问修改代码后需如何操作能生效呢?万分感谢!

xiaomumu02 avatar Apr 05 '25 15:04 xiaomumu02

这个问题已经被标记为 stale ,因为它已经超过 30 天没有任何活动。

github-actions[bot] avatar May 05 '25 21:05 github-actions[bot]

这个问题已经被自动关闭,因为它被标为 stale 后超过 14 天没有任何活动。

github-actions[bot] avatar May 19 '25 21:05 github-actions[bot]