HEngine icon indicating copy to clipboard operation
HEngine copied to clipboard

add hashes dynamically

Open vinnitu opened this issue 10 years ago • 1 comments

I try to add hashes to hengine dynamically. With sorted tables it's ok. But what we can do with bloom_filer? By source code we pass constant db.size() to filter params when build tables. So does it mean we must recalculate m_filter contents with new values?

По-русски

Пытаюсь добавить функциональность в модуль - добавление хешей на лету. С самими отсортированными таблицами сегментирования всё ясно. А вот досточно ли сделать m_fileter.insert() для добавления r-hasha или нужно пересчитывать внутренние значения фильтра блума?

vinnitu avatar Jan 23 '15 13:01 vinnitu

Здравствуйте. -А вот досточно ли сделать m_fileter.insert() для добавления r-hasha или нужно пересчитывать внутренние значения фильтра блума?

Судя по вики и реализации вроде при добавлении нового элемента в фильтр увеличивает вероятность ложноно срабатывания. Так как количество хешфункций создается примерно исходя из требующейся вероятности и количества элементов.

Возможно стоит проверить как много можно добавить элементов сверх, чтобы прирост производительности стал незначительным.

(Добавлять новые элементы, а после некоторого предела, перегенерировать фильтры)

valbok avatar Jan 23 '15 14:01 valbok