MaxKB
MaxKB copied to clipboard
[FEATURE]增加忽略特定关键词对命中率影响的功能
MaxKB 版本
1.0.4
请描述您的需求或者改进建议
如我的 question 为:“我是一个名字很长很长的产品问题一”,其实只有问题一是关键信息,目前的版本这样则会因为“我是一个名字很长很长的产品”的前缀匹配到很多类似“我是一个名字很长很长的产品问题二/三/四/五/六/七/八”关联度比较低的段落,除非我录入了一个准确的“我是一个名字很长很长的产品问题一”
请描述你建议的实现方案
可以忽略特定关键词,这样在做向量查询的时候能更准确
附加信息
No response
感谢反馈,全文检索会根据词义进行检索,你可以先试用一下混合检索,精确度会提高。 我们也考虑一下。
不太明白,全文检索的描述写的是返回匹配文字最多的分段,那不正好是我提的这个场景的反例吗 “我是一个名字很长很长的产品问题一” 关键词实际只有问题一,但因为产品名字占比很高,所以匹配“我是一个名字很长很长的产品”这部分的内容最多,跟预期不一致了啊
混合检索的参数和Rerank的模型在哪里可以灵活配置下?感觉如果检索灵活度能如Ragflow就完美了