Ondrej Kokes

Results 204 issues of Ondrej Kokes

V kódu je obezlička (hledej `angos`), tak bych to asi zalogoval a pak investigoval. Zatim ta data zahazuju :(

Data (od slova datum) jsou občas ve špatném formátu. - datum vzniku je dd.mm.yyyy - `datRozhodnutihOs` nebo `datVyveseni` je dd-mm-yyyy (konkurs prohlášení)

Asi neni potřeba zpracovávat údaje nějak jinak než podúdaje - možná bych to spojil do jednoho dlouhého listu (jako teď dělám v podúdajích a podpodúdajích).

Viz komentáře v kódu, některé údaje a podúdaje jsou korelované a možná budem potřebovat informace mezi nima.

U pár subjektů chybí IČO - přeskakujem a logujem je, takže investigace by měla být celkem nesložitá.

U většiny voleb nemáme žádné regionální rozdělení, chtělo by to přidat. Asi to nebude součástí existujícího frameworku, protože tam se různě mapujou ty strany, ale bude to fajn.

novy-poddataset

Je tam trochu problém s druhem vystoupení řečníka (viz https://www.psp.cz/sqw/hp.sqw?k=1310) Ale jinak asi cajk? ```sql with vystoupeni as ( SELECT *, -- Druh vystoupení řečníka: 0 či null - neznámo,...

Asi jen na úrovni právnických osob, pro prolinkování s ostatníma datama. Vůbec jsem do toho nekoukal, takže ani nevim, kterou z těch webovejch služeb použít spíš. https://isir.justice.cz/isir/common/stat.do?kodStranky=SLEDOVANIWS

novy-dataset
netrivialni

Moc to sem nepatří. Přesunout i issues.

Navazuje na #62 Chybí: - [ ] inkrementální load - [ ] zpracování obrázků - [ ] testy pro XML extrakci

pahyl
nice-to-have
data-quality