Ondrej Kokes
Ondrej Kokes
V kódu je obezlička (hledej `angos`), tak bych to asi zalogoval a pak investigoval. Zatim ta data zahazuju :(
Data (od slova datum) jsou občas ve špatném formátu. - datum vzniku je dd.mm.yyyy - `datRozhodnutihOs` nebo `datVyveseni` je dd-mm-yyyy (konkurs prohlášení)
Asi neni potřeba zpracovávat údaje nějak jinak než podúdaje - možná bych to spojil do jednoho dlouhého listu (jako teď dělám v podúdajích a podpodúdajích).
Viz komentáře v kódu, některé údaje a podúdaje jsou korelované a možná budem potřebovat informace mezi nima.
U pár subjektů chybí IČO - přeskakujem a logujem je, takže investigace by měla být celkem nesložitá.
U většiny voleb nemáme žádné regionální rozdělení, chtělo by to přidat. Asi to nebude součástí existujícího frameworku, protože tam se různě mapujou ty strany, ale bude to fajn.
Je tam trochu problém s druhem vystoupení řečníka (viz https://www.psp.cz/sqw/hp.sqw?k=1310) Ale jinak asi cajk? ```sql with vystoupeni as ( SELECT *, -- Druh vystoupení řečníka: 0 či null - neznámo,...
Asi jen na úrovni právnických osob, pro prolinkování s ostatníma datama. Vůbec jsem do toho nekoukal, takže ani nevim, kterou z těch webovejch služeb použít spíš. https://isir.justice.cz/isir/common/stat.do?kodStranky=SLEDOVANIWS
Moc to sem nepatří. Přesunout i issues.
Navazuje na #62 Chybí: - [ ] inkrementální load - [ ] zpracování obrázků - [ ] testy pro XML extrakci