zcdb

Results 118 comments of zcdb

看接口表里面是有9亿数据,我们复现排查下这种情况。请问具体版本是那个呢?

是用的3.2.7的容器镜像?还是使用3.2.7的源码编译的呢?或者可以提供下gamma.log里面第一行的版本信息吗?类型于这种gamma_api.cc:88 Version [[sha1]:10514c2 [author]

插入方式是批量插入还是单条插入?搜索是用的search接口还是msearch?

具体版本可以提供一下吗?

向量维度多少呢?搜索设置的nprobe多少呢?一般而言ivfpq的recall@1是不会很高的,80%左右应该是正常的,另外加上重排即搜索的时候设置"quick": false,可以提高recall@1

> 我也遇到了同样的问题,1亿数据量下,用特征向量检索,尽然连本身也搜索不到 建表语句 > > ``` > "dynamic_schema": "strict", > "partition_num": 3, > "replica_num": 2, > "engine": {"name": "gamma", > "index_size": 81920, # [ncentroids * 39, ncentroids * 256] >...

可以通过health接口 https://vearch.readthedocs.io/zh_CN/latest/use_op/cluster_status.html#id3 查看是否开始构建索引了,即index_status字段不为0,如果索引没有训练完是无法通过索引进行搜索的,需要添加is_brute_search:1。另外建议使用v3.2.7版本,3.1.0版本太老了,应该没有is_brute_search选项,估计是另一个字段

1.128维和512维向量检索的性能问题,这个也跟建表参数有关,如果参数一致,性能是接近的,不过一般而言128维和512维设置的nsubvector不一样,性能是会不一样的 2.看你的问题主要是去年6月测试性能较好,然后现在测试发现相比之前性能不高是吧?两个测试代码版本都是哪个呢?另外之前测试和现在测试集群ps数量不一样,router数量有差别吗?搜索语句也贴一下吧

> 另外,如果是我设置10个ps,每个3副本,每个ps存一千万的数据,这样可以吧? 可以,这样应该会明显提升QPS的

看着像是load的时候索引数量大于load的向量数导致失败,load的时候会检查向量数量和正排数量是否一致,看看是否之前有插入失败的情况