李毅
李毅
> 安装包版本不兼容的问题,我也出现过这个问题,解决方案:accelerate-0.25.0 、bitsandbytes-0.41.1 奥奥,好的,非常感谢!
好的,非常感谢!再问两个问题啊: 1.使用sparse向量进行检索的话是否需要将句子中的停用词和标点等无用标识去掉,以提高检索的准确性? 2.是否支持并开源无监督版的对比学习训练代码?
奥奥,非常感谢! 最近又发现了几个问题,可否帮忙看下啊? 目前的需求是对相似文章的段落做内容召回,将bge-m3输出的sparse+稠密向量导入milvus使用混合检索以及基于倒数排序融合(RRF): 1.检索结果中的distance此时等同于分数吗,就是distance越大,相似度越高? 2.需对召回结果设置一个阈值,这个阈值的话该怎样设置(distance比较低且都比较接近)? 3.返回的top3中,distance似乎都不高,而且很奇怪的是(1)top1和top2的内容不同,但distance相同, (2)top2和top3的内容相同,但distance不同。 4.rerank的无监督版本的微调,是否可以参照embeding的策略 “标题-正文” ?