março 19, 2020

Coletando e visualizando dados do Coronavírus

Por data2learning

Em época de Coronavírus e de chuva de informações, várias iniciativas estão aparecendo para coletar, analisar e visualizar dados relacionados ao COVID-19. Essas tarefas são de extrema importância já que fornecem um ferramenta para os especialistas entenderem como essa epidemia está se espalhando pelo Brasil e Mundo. Nesse primeiro tutorial do blog, mostro como podemos coletar e visualizar esses dados utilizando Python, Plotly e Pandas. Além disso, listo algumas iniciativas relacionadas que estão disponíveis na internet.

Coletando e Visualizando

Neste notebook mostro como visualizar alguns dados referentes ao COVID19. Os dados foram disponibilizados neste GitHub pela Johns Hopkins University Center. Utilizei a base que mostra os dados reportados no mundo inteiro a cada dia. A proposta é mostrar a partir dos dados como a doença está evoluindo no Brasil e no Mundo.

A proposta é agregar neste espaço outras bases de dados para mostrar como a doença está se espalhando pelo Brasil em relação a outros países do mundo. Ao longo do tutorial vou limitar a mostrar os gráficos e explicar a proposta do mesmo. Não farei nenhuma análise mais aprofundada do comportamento das curvas. Acredito que isso pode ser melhor explanado por pessoas de outras áreas. A minha proposta é mostrar como podemos usar alguns métodos de visualização de dados para ter uma melhor visão do que está acontecendo.

Usei duas bibliotecas no tutorial: (1) Plotly: para visualização dos dados e Pandas para carregar e manusear os dados.

Esse trabalho foi inspirado por algumas propostas do Canal Peixe Babel. Clique aqui para acessar o repositório deles.

O tutorial completo está disponível no meu GitHub: https://github.com/adolfoguimaraes/covid19. A medida que novos dados forem aparecendo, assim como novos tipos de gráficos, irei atualizar os repositórios. O dashboard pode ser visualizado no link: https://covid19.data2learning.com/.

A seguir segue a galeria de gráficos já gerados:

Gráfico 1: Dados do Mundo

Os dados disponibilizados pela Johns Hopkins contém dados de todo o mundo. A minha primeira proposta de visualização é dos dados de casos espalhados no mundo em um WorldMap.

Gráfico 2: Dias até o primeiro registro

O segundo gráfico mostra quantos dias levaram para os países terem o primeiro registro de coronavírus. A data inicial é 31/12/19 quando o governo Chinês informou a OMS dos primeiros casos.

Gráfico 3: Dados do Brasil

O terceiro gráfico mostra a quantidade de dados registrados no Brasil por cada estado.

Gráfico 4: Evolução dos casos no Brasil

O gráfico 4 mostra como os dados estão evoluindo no Brasil a cada dia. Usei dados a partir de 17/03/20. São mostrados os dados reportados pelas secretarias.

Gráfico 5: Evolução Brasil e Itália

O surto começa em cada país em dias diferentes. Esse gráfico mostra o comportamento da curva de casos confirmados nos X primeiros dias do surto. A referência do X é sempre o Brasil. Por exemplo, se o Brasil está no vigésimo dia do surto, o gráfico vai mostrar os valores dos primeiros 20 dias de surto de cada país, mesmo que o mesmo já esteja no trigésimo dia de contaminação.

Outras iniciativas