gengxu270998
Results
3
comments of
gengxu270998
你好,partitionCount变量是每个分桶根据多项式的最高阶对分桶内元素进行分块后得到的分块数目。服务端在计算时需要对于每一个分块分别进行计算,因为服务端无法确定,如果某个元素属于交集集合时,该元素在哪个分块。 我没有太理解你说的布谷hash两次填充的意思,我理解布谷hash分桶数目是固定的,因此所要存储元素总量也是固定的。 不确定有没有解释清楚你的问题,如果还有疑惑,请随时与我们交流。
去掉重复是因为在计算多项式f(x)时,相同的x要对应相同的y,否则无法差值计算出多项式系数。第二次分桶确实可以优化内存,我们实现时没有考虑这一块,也可以在多项式编码时,再对是空的元素取与客户端不等的值也可以。
由于系数的比特长度只有20比特左右,需要用多个系数表示一个数据。itemEncodedSlotSize表示需要使用的系数个数。你提到的这两个地方是同一个意思,一个是服务端的操作,一个是客户端的操作。