xiaoli233

Results 4 issues of xiaoli233

Term dict index以FST的结构存缓存在内存中,从Term dict index查到关键词对应的term dic的块位置之后,再去磁盘上找term,大大减少了磁盘的IO次数。 1、(内存)内存加载tip文件,根据FST匹配到后缀词块在tim文件中的位置; 2、(内存)根据查询到的后缀词块位置查询到后缀及倒排表的相关信息; 3、(内存)根据tim中查询到的倒排表信息从doc文件中定位出文档号及词频信息,完成搜索; 4、(磁盘)文件定位完成后Lucene将去.fdx文件目录索引及.fdt中根据正向索引查找出目标文件 这个过程没问题吧?

博客[https://www.amazingkoala.com.cn/Lucene/Index/2019/0513/58.html](url),计算log值这步骤似乎没啥用处,后续合并也没有用到这个值

拜读大神文章,点开其中一篇博客分享的[文章链接](https://www.elastic.co/cn/blog/save-space-and-money-with-improved-storage-efficiency-in-elasticsearch-7-10),发现里面有个Deflate压缩功能,想问问大神有没有Deflate相关文章介绍说明

请问大神lsm tree在lucene那里用到了?我看有些博客说字符串的范围检索底层使用lsm tree存储的,请问您有没有讲到这块的底层原理博客