vincent comments

Results 31 comments of


                                            vincent

有微信群嘛？

![FDA75CA5-456F-4518-BAC3-4FCB62653D40](https://user-images.githubusercontent.com/15918167/173509944-8f924930-1b4a-478e-a9d4-4a6a78bdb8f8.png) @caixuzhong1

是否可以先过滤再计算余弦相似度

先确定下两个问题： 1、ids这个字段是想用term filter功能来过滤满足条件的结果吗？ 2、索引的总向量多少？

> > 先确定下两个问题： > > 1、ids这个字段是想用term filter功能来过滤满足条件的结果吗？ > > 2、索引的总向量多少？ > > 1. ids是想用来做filter, 我想用vearch来做粗排，ids可能是5000个，想先过滤，基于过滤的结果再计算相似度 > 2. 总量在500w左右，后期可能有1亿的场景 > > 如果用faiss现有的算法会导致有损的召回，所以想着能否先过滤，再召回，麻烦您了可以的，你可以对这些向量打个标签，先用标签过滤，就是term filter，可以先过滤，然后再在滤过后的结果集里用检索模型召回。有过滤条件的话，gamma引擎检索都是在遍历索引过程中先根据条件过滤，满足过滤条件的向量，才进一步量化计算和召回，避免对不符合条件的向量重复计算量化近似距离。

多表之间并行度如何提高？

@xincrazy 建议针对每个表，单独发送请求query试试

多表之间并行度如何提高？

一个查询同时查询多张表的query能发下看看么？

多表之间并行度如何提高？

用批量接口了吗？如果是数据量大的查询，建议用batch方式

请问vearch可以在国产ARM架构的服务器上使用么？

有社区华为开发者反馈说是可以使用，可能要稍微改点代码，可惜这部分代码没有贡献进来。由于没有国产arm架构服务器测试环境，我们自己还没实际跑过。

加载未完成时查询，进程崩溃

多大数据量，现场写请求和搜索请求均有是吗？现场能多描述描述崩溃时现象吗？

关于索引的训练问题

1、indexsize在设置后，第一次插入数量满足阈值后，触发索引训练。有了索引后不会再次触发。 2、目前还不支持通过配置，重新训练

关于索引的训练问题

支持手动控制索引的重新训练，对现有代码有些改造，我们先评估下