Ondrej Kokes
Ondrej Kokes
https://ms14opendata.mssf.cz - [ ] komentare v SQL - [ ] snowflake tabulky (pravni formy?) - [ ] vyzvy a dalsi datasety - [ ] hezci nazvy sloupcu (zejm. financování) -...
Možná by nebylo na škodu vzít faktury různých subjektů (asi zejm. ministerstva, možná města?) a sjednotit je jako nový dataset. Krom dvou ministerstev by mělo být vše zveřejněné.
Bylo by fajn, kdyby ta data měla nějaké fixní schéma, fixní URL, CSV formát atd.
Zaniklé subjekty jsou bohužel v historických datasetech, nejsou nikde na jednom místě, takže člověk musí jít do historie, přeskakovat 99 % dat (pomocí IČO v hash mapě) a parsovat jen...
Zatim to nemá webový ksicht, ale ta dvě podstatná CSV jsou zde: - [Projekty Technologické agentury ČR (včetně nepodpořených)](https://data.tacr.cz/resource/project/headers/) - [Účastníci projektů (včetně nepodpořených)](https://data.tacr.cz/resource/project/participants/) Asi to bude chtít úplně minimální...
Pokud se podaří plně prokopnout justiční data (viz https://github.com/kokes/od/milestone/1), tak bychom mohli nějak archivovat API ARES věci (a zničit závislost na psycopg2 v requirements).
Předpokládám ruční stažení dat, to bychom asi měli doplnit.
Je pár věcí, který bychom mohli zlepšit: - btree index nad `ico` u všech tabulek - btree nad `ico_angos` u angažovaných osob - btree nad `lower(jmeno || ' ' ||...