covid19-br icon indicating copy to clipboard operation
covid19-br copied to clipboard

[Pergunta] Os dados estão sendo atualizados retroativamente?

Open maurozac opened this issue 4 years ago • 6 comments

Pessoal, fica esta pergunta, cuja resposta poderia ser incluída nas FAQs.

"Os dados estão sendo atualizados retroativamente?"

Por causa dos atrasos nos testes, as secretarias estão lançando dados que atualizam dias anteriores e não apenas o dia corrente. Seria importante ter certeza que a metodologia incorpora essas atualizações.

By the way, estou usando os dados daqui para este projeto experimental de projeção: https://github.com/Maurozac/covid-br/blob/master/compara.py (ainda em construção)

E aproveito para deixar aqui um salve para todos os envolvidos neste projeto. Estão todos de parabéns pelo esforço de divulgar dados de qualidade de forma aberta e passível de automação. Que esse exemplo seja um dia seguido pelas autoridades que infelizmente insistem em sentar em cima dos dados públicos e dificultar sistematicamente o acesso (vide o site oficial do governo https://covid.saude.gov.br/ que tem um csv para baixar, só que não => incluem toda uma parafernália de scripts para impedir a coleta automatizada do dado => isso é pura CANALHICE => te obriga a ficar igual a um otário baixando manualmente).

maurozac avatar Apr 13 '20 16:04 maurozac

Segue um exemplo de caso concreto, que pode ser observado nos boletins de coronavírus do DF, referente ao dia 11/4:

No caso deste exemplo, seria ainda mais difícil fazer uma extração automática, porque os números dos dias anteriores só existem dentro de um gráfico que é uma imagem dentro de um arquivo PDF.

augusto-herrmann avatar Apr 14 '20 13:04 augusto-herrmann

Em alguns estados, sim (nem todos atualizam retroativamente). O ideal é que atualizemos o histórico de todos, sempre referenciando no boletim do dia (do passado) que foi alterado porque aquela alteração foi feita. Isso obviamente nos dá muito mais trabalho - por isso estou correndo aqui pra gente conseguir colocar o novo sistema de envio das planilhas online, isso vai nos dar muito menos de trabalho na checagem dos dados e possibilitará já colocarmos os robôs para atualizarem os dados (nos estados em que conseguirmos criar programas para capturar os dados). Com o tempo (com a nossa pressão e de outras instituições), as Secretarias Estaduais de Saúde começarão a disponibilizar os dados de maneira mais estruturada (isso já está acontecendo) e conseguiremos ir automatizando aos poucos.

turicas avatar Apr 14 '20 15:04 turicas

Há boletins que atualizam os dados referentes aos dias anteriores apenas do total de casos confirmados, mas não outros dados essenciais, como, por exemplo, o número de óbitos. Esses estão disponíveis apenas para o dia corrente.

Em casos assim faria sentido atualizar somente com a informação disponível (casos confirmados) mesmo que isso possa ficar incoerente com outros dados cuja revisão não está disponível para os dias anteriores (óbitos)? @turicas

augusto-herrmann avatar Apr 17 '20 01:04 augusto-herrmann

Há boletins que atualizam os dados referentes aos dias anteriores apenas do total de casos confirmados, mas não outros dados essenciais, como, por exemplo, o número de óbitos. Esses estão disponíveis apenas para o dia corrente.

Em casos assim faria sentido atualizar somente com a informação disponível (casos confirmados) mesmo que isso possa ficar incoerente com outros dados cuja revisão não está disponível para os dias anteriores (óbitos)? @turicas

Nesses casos eles disponibilizam por município ou somente o total no estado? Se for somente o total no estado, ficaremos com números diferentes (somando os municípios versus total no estado) para aquele dia (isso não necessariamente é um problema, mas não é o ideal).

turicas avatar Apr 17 '20 10:04 turicas

Nesses casos eles disponibilizam por município ou somente o total no estado? Se for somente o total no estado, ficaremos com números diferentes (somando os municípios versus total no estado) para aquele dia (isso não necessariamente é um problema, mas não é o ideal).

O exemplo que eu conheço é do DF, que não tem municípios. Mas tem Regiões Administrativas, para as quais os números estão no boletim mas nós não coletamos – mas isso é uma outra discussão. Nesse caso, somente o total de casos confirmados tem os dados retroativos. Mas nenhuma outra informação está disponível sobre a revisão dos dias anteriores.

augusto-herrmann avatar Apr 17 '20 17:04 augusto-herrmann

Para finalizar essa issue, alguém poderia fazer um resumo do que foi perguntado/respondido e colocar no faq.md?

turicas avatar Apr 21 '20 21:04 turicas