vincent

Results 31 comments of vincent

![FDA75CA5-456F-4518-BAC3-4FCB62653D40](https://user-images.githubusercontent.com/15918167/173509944-8f924930-1b4a-478e-a9d4-4a6a78bdb8f8.png) @caixuzhong1

先确定下两个问题: 1、ids这个字段是想用term filter功能来过滤满足条件的结果吗? 2、索引的总向量多少?

> > 先确定下两个问题: > > 1、ids这个字段是想用term filter功能来过滤满足条件的结果吗? > > 2、索引的总向量多少? > > 1. ids是想用来做filter, 我想用vearch来做粗排,ids可能是5000个,想先过滤,基于过滤的结果再计算相似度 > 2. 总量在500w左右, 后期可能有1亿的场景 > > 如果用faiss现有的算法会导致有损的召回,所以想着能否先过滤,再召回, 麻烦您了 可以的,你可以对这些向量打个标签,先用标签过滤,就是term filter,可以先过滤,然后再在滤过后的结果集里用检索模型召回。 有过滤条件的话,gamma引擎检索都是在遍历索引过程中先根据条件过滤,满足过滤条件的向量,才进一步量化计算和召回,避免对不符合条件的向量重复计算量化近似距离。

@xincrazy 建议针对每个表,单独发送请求query试试

一个查询同时查询多张表的query能发下看看么?

用批量接口了吗?如果是数据量大的查询,建议用batch方式

有社区华为开发者反馈说是可以使用,可能要稍微改点代码,可惜这部分代码没有贡献进来。由于没有国产arm架构服务器测试环境,我们自己还没实际跑过。

多大数据量,现场写请求和搜索请求均有是吗?现场能多描述描述崩溃时现象吗?

1、indexsize在设置后,第一次插入数量满足阈值后,触发索引训练。有了索引后不会再次触发。 2、目前还不支持通过配置,重新训练

支持手动控制索引的重新训练,对现有代码有些改造,我们先评估下