MaxKB icon indicating copy to clipboard operation
MaxKB copied to clipboard

[FEATURE]增加忽略特定关键词对命中率影响的功能

Open fitchibing opened this issue 1 year ago • 3 comments

MaxKB 版本

1.0.4

请描述您的需求或者改进建议

如我的 question 为:“我是一个名字很长很长的产品问题一”,其实只有问题一是关键信息,目前的版本这样则会因为“我是一个名字很长很长的产品”的前缀匹配到很多类似“我是一个名字很长很长的产品问题二/三/四/五/六/七/八”关联度比较低的段落,除非我录入了一个准确的“我是一个名字很长很长的产品问题一”

请描述你建议的实现方案

可以忽略特定关键词,这样在做向量查询的时候能更准确

附加信息

No response

fitchibing avatar Apr 29 '24 06:04 fitchibing

感谢反馈,全文检索会根据词义进行检索,你可以先试用一下混合检索,精确度会提高。 我们也考虑一下。

baixin513 avatar Apr 29 '24 22:04 baixin513

不太明白,全文检索的描述写的是返回匹配文字最多的分段,那不正好是我提的这个场景的反例吗 “我是一个名字很长很长的产品问题一” 关键词实际只有问题一,但因为产品名字占比很高,所以匹配“我是一个名字很长很长的产品”这部分的内容最多,跟预期不一致了啊

fitchibing avatar Apr 30 '24 01:04 fitchibing

混合检索的参数和Rerank的模型在哪里可以灵活配置下?感觉如果检索灵活度能如Ragflow就完美了

wwweber avatar May 11 '24 15:05 wwweber