es_pandas
es_pandas copied to clipboard
Read, write and update large scale pandas DataFrame with Elasticsearch
对于相同映射关系的index,比如按日期保存的数据,应该支持将多个index中的数据导入一个DataFrame中。 比如 index-2022-01, index-2022-02, index-2022-03 ... df = ep.to_pandas('index-2022*',...)
如果不显示进度,则不应该计算index中的文档数。 特别是index中的文档数量巨大或index数量多时,会节约开销。
Running below command, does not update the records in elasticsearch. ep.to_es(df.iloc[:1000, 1:], index, doc_type=doc_type, _op_type='update') N/A% (0 of 1000) | | Elapsed Time: 0:00:00 ETA: --:--:-- 1000
How to implement pagination, specifically from/size parameters as the query_rule parameter does not accept from and size ?