COVID-19
COVID-19 copied to clipboard
👉 Richiesta di chiarimenti su procedure di validazione della forma del dato (follow-up)
Buongiorno a tutti, torno nuovamente sull'argomento validazione automatica della forma dato.
Di cosa sto parlando?
Specifico che in questa issue mi sto riferendo alla validazione "tecnica" dal dato e non a quella "semantica". Non sto parlando di eventuali inconsistenze del numero in sé. Mi rendo conto che il dato segua dei processi di certificazione che trascendono l'aspetto tecnico. Mi riferisco invece a come i dati vengono impacchettati nei file rilasciati, che è invece un problema squisitamente informatico.
Che tipo di problemi genera?
Gli errori di natura tecnica che talvolta accadono (e.g., errori di serializzazione, problemi di encoding, unexpected tokens, presenza di duplicati, etc...), bloccano i processi di acquisizione dati automatica dei tanti progetti che si appoggiano a questo repo. Riporto qui alcune referenze alle problematiche citate: #1059 #1046 #943, #923, #911, #908, etc...
Motivo del follow-up
Alcuni mesi fa sono emerse interessanti discussioni sul tema (cito a titolo esemplificativo e non esaustivo la #945 e la #982). Sono stati sollevati molti quesiti ed idee interessanti che purtroppo non hanno ricevuto, ad oggi, alcun feedback.
Domande aperte
Senza troppi giri di parole:
- esiste un processo di validazione "tecnica" del dato?
- in caso affermativo potreste condividerlo o illustrarne il funzionamento?
- vi siete per caso fatti un'idea del perché questo tipo di errori stia continuando ad accadere? (Spesso permangono fino al rilascio dati successivo 24h più tardi)
- avete in programma di fixare queste criticità , oppure ritenete che non ci sia la possibilità /necessità di farlo?
@umbros e @pierluigicara, perdonate la mention, ma converrete con me che questi quesiti, sollevati a più riprese, meritino una risposta. Quantomeno per prendere atto dello stato delle cose e capire cosa aspettarsi.
Ciao e grazie per il vostro lavoro!
Mi aggrego alla richiesta di chiarimenti, con il solo intento di capire quali siano i filtri ( se presenti ).
Grazie mille