simaki
simaki
Provide English version of README.md.
e-Stat API の仕様上、100000 件を超えるデータは一度に取得することができない。 100000 件以下のデータを繰り返し取得し、データフレームを結合することで、100000 件を超えるデータを一回の関数呼び出しで取得できるようにする。
現状、pandas.DataFrame が得られることのみテストしており、その中身が正しいことをテストしていないので、これをテストする。
英語 (`lang="E"`) の結果の正しさをテストしていないので、これをテストする。
https://github.com/simaki/pandas-estat/blob/7fd92b3267de348de1a0102ea5e59f4c9ab7bd9f/pandas_estat/base.py#L33-L34
https://github.com/simaki/pandas-estat/blob/7fd92b3267de348de1a0102ea5e59f4c9ab7bd9f/pandas_estat/statsdata.py#L115-L116 https://github.com/simaki/pandas-estat/blob/7fd92b3267de348de1a0102ea5e59f4c9ab7bd9f/pandas_estat/statsdata.py#L115-L116
e-Stat で特殊処理を行っていることを示す記号を、欠損値としてパースする。 つまり、DataFrame 中の次の文字列を NA に変換する。 * 集計に必要なデータがない `***` * 秘匿データ `X` 参照 * チェック項目 1-13 数値データの同一列内に特殊記号(秘匿等)が含まれる場合 https://www.e-stat.go.jp/estat/html/Notation_method.pdf
統計メタ情報を取得するクラス `StatsMetaReader`, 関数 `read_statsmeta` を実装する。 クラスは `BaseReader` を継承する。