Hui Chen

Results 38 comments of Hui Chen

你需要一个 data_node 服务,异步从各个数据库更新字段,不要做同步查询 我们内部已经实现了这样的架构,以后有机会开放出来

@csrgxtu lucene 可能是直接持久化存储了倒排索引。不过理论上应该不会有数量级的差别,你载入慢可能有其他原因,看看是不是其他模块的 IO 比较慢。

微博已经限制了 API,现在只能抓取自己的帖子了,所以这个工具已经失效

目前不支持这样的功能,只能通过搜索两次然后在业务层实现并的逻辑

docid会哈希到不同shard,engine返回的结果和shard数目无关,多个shard是为了提高并发度。

恩,一个shard对应一份索引表

1、貌似没有merge最新的master 2、像docid从uint64转为string是非常大的改动,需要评估需求和对性能的影响 另外change有些大,请split成几个小的request分别提交。

你是说从排序器中提取评分字段的信息?