Yuxi-Know icon indicating copy to clipboard operation
Yuxi-Know copied to clipboard

Question: 为什么新版的检索测试无论输入什么查询条件都能返回知识图谱答案?

Open zhuweigang opened this issue 2 months ago • 4 comments

问题描述 随意输入点什么文字,和知识库文章一点内容都不相关的都会返回知识库的内容,这个一般是什么原因导致?

Image

zhuweigang avatar Dec 27 '25 06:12 zhuweigang

LightRAG 的检索直接走的是 LightRAG 的接口,可能是一些配置参数要调整?

xerrors avatar Dec 27 '25 09:12 xerrors

这个。。。大家测试没发现同样问题吗?难道只有我这里会这样?大家也需要调整参数?

zhuweigang avatar Dec 27 '25 11:12 zhuweigang

不,我测试也是这样的,不过因为实际 agent 应用中影响不大。

检索重要的是,需要的东西有没有被查到,如果没有需要的东西,只查到的一些无关的,这就证明这个知识库没有想要的东西,说明查错知识库了。

所以这个实际上没有任何影响,在 agent 应用中,我们会给智能体提供知识库的名称和描述,智能体就会自行选择合适的知识库去检索。检索到无关的东西也没关系,换个知识库就好。

另外,刚才去看了一下 LightRAG 也没有相关的参数。所以我的建议是这个不需要做考虑

xerrors avatar Dec 27 '25 15:12 xerrors

@zhuweigang lightrag中有相关参数的你可以看看源码中tools/constants.py的参数释义以及.env中的参数释义,在这两个文件中配置都可以调节检索方式和效果。至于为什么会检索出无关的,这个不仅和参数有关,lightrag是采用双重检索的,你输入的query"万科是什企业"是经过llm抽取关键词 分为高维语义检索和低纬语义检索的 分别对应图检索和向量检索,最终的检索结果直接叠加合并,目测你是提问的query是跟知识库中不相关的,但是向量检索一定是要有topk的,再加上检索参数的不合理设置因此会检索到无关的chunk 而图检索是先从向量库中检索出entity relation的关键词才能进入后续的知识图谱中检索的,因此这个entity relation的关键词也是向量检索也是要有前top个返回的,说白了就是lightrag中的默认参数不能针对极端情况。不过这样也没关系,把检索到的知识交给llm,设置prompt让llm判断一下要不要引用这个知识就行了,基本不会影响最终的回答效果的

zhouenxian avatar Dec 29 '25 01:12 zhouenxian