Coletando e visualizando dados do Coronavírus
Em época de Coronavírus e de chuva de informações, várias iniciativas estão aparecendo para coletar, analisar e visualizar dados relacionados ao COVID-19. Essas tarefas são de extrema importância já que fornecem um ferramenta para os especialistas entenderem como essa epidemia está se espalhando pelo Brasil e Mundo. Nesse primeiro tutorial do blog, mostro como podemos coletar e visualizar esses dados utilizando Python, Plotly e Pandas. Além disso, listo algumas iniciativas relacionadas que estão disponíveis na internet.
Coletando e Visualizando
Neste notebook mostro como visualizar alguns dados referentes ao COVID19. Os dados foram disponibilizados neste GitHub pela Johns Hopkins University Center. Utilizei a base que mostra os dados reportados no mundo inteiro a cada dia. A proposta é mostrar a partir dos dados como a doença está evoluindo no Brasil e no Mundo.
A proposta é agregar neste espaço outras bases de dados para mostrar como a doença está se espalhando pelo Brasil em relação a outros países do mundo. Ao longo do tutorial vou limitar a mostrar os gráficos e explicar a proposta do mesmo. Não farei nenhuma análise mais aprofundada do comportamento das curvas. Acredito que isso pode ser melhor explanado por pessoas de outras áreas. A minha proposta é mostrar como podemos usar alguns métodos de visualização de dados para ter uma melhor visão do que está acontecendo.
Usei duas bibliotecas no tutorial: (1) Plotly: para visualização dos dados e Pandas para carregar e manusear os dados.
Esse trabalho foi inspirado por algumas propostas do Canal Peixe Babel. Clique aqui para acessar o repositório deles.
O tutorial completo está disponível no meu GitHub: https://github.com/adolfoguimaraes/covid19. A medida que novos dados forem aparecendo, assim como novos tipos de gráficos, irei atualizar os repositórios. O dashboard pode ser visualizado no link: https://covid19.data2learning.com/.
A seguir segue a galeria de gráficos já gerados:
Gráfico 1: Dados do Mundo
Os dados disponibilizados pela Johns Hopkins contém dados de todo o mundo. A minha primeira proposta de visualização é dos dados de casos espalhados no mundo em um WorldMap.
Gráfico 2: Dias até o primeiro registro
O segundo gráfico mostra quantos dias levaram para os países terem o primeiro registro de coronavírus. A data inicial é 31/12/19 quando o governo Chinês informou a OMS dos primeiros casos.
Gráfico 3: Dados do Brasil
O terceiro gráfico mostra a quantidade de dados registrados no Brasil por cada estado.
Gráfico 4: Evolução dos casos no Brasil
O gráfico 4 mostra como os dados estão evoluindo no Brasil a cada dia. Usei dados a partir de 17/03/20. São mostrados os dados reportados pelas secretarias.
Gráfico 5: Evolução Brasil e Itália
O surto começa em cada país em dias diferentes. Esse gráfico mostra o comportamento da curva de casos confirmados nos X primeiros dias do surto. A referência do X é sempre o Brasil. Por exemplo, se o Brasil está no vigésimo dia do surto, o gráfico vai mostrar os valores dos primeiros 20 dias de surto de cada país, mesmo que o mesmo já esteja no trigésimo dia de contaminação.