# Coronavírus: dados no Brasil Essa página procura colacionar fontes de dados primários confiáveis para monitoramento e modelagem da crise epidêmica do coronavírus, apoiando-se em contribuições de cientistas de dados voluntários. Acreditamos que a colaboração entre voluntários pode trazer mais transparência aos dados disponíveis e maior confiabilidade aos modelos preditivos submetidos ao escrutínio público. A falta de transparência quanto aos dados e modelos preditivos empregados pelo Estado multiplica as incertezas da própria epidemia, o que só aumenta a insegurança geral quanto à adequação da resposta governamental. Alegam querer proteger a sociedade do pânico, mas o atual gargalo informacional confiável só aumenta a incerteza, permitindo a veiculação de boatos e *fake news*. Precisamos de um relato isento e competente sobre os modelos preditivos já produzidos, garantindo a publicidade dos dados subjacentes para que a sociedade possa tomar decisões esclarecidas e avaliar as ações governamentais. **CONTRIBUIÇÕES**: Todo esse site é *livrement editável* por todo interessado. Caso identifique uma fonte relevante, basta clicar no botão "edit" no topo da página e inserir a referência na seção adequada. Colaborando abertamente dessa forma, acreditamos que melhoraremos a qualidade das informações disponíveis para combater a crise ## Fontes de dados Além das fontes de dados validadas com endereço (url) para acesso, pode-se sugerir também possíveis fontes de dados que já existam e precisariam ser publicadas ou uma lista de desejos de conjuntos de dados úteis para análise. ### Brasil - Boletins epidemiológicos do Ministério da Saúde (MS): https://www.saude.gov.br/boletins-epidemiologicos - Números oficiais do MS : http://plataforma.saude.gov.br/novocoronavirus/ - a série histórica não é visualizada diretamente na plataforma, mas pode ser acessada por meio de um dicionário javascript em: http://plataforma.saude.gov.br/novocoronavirus/resources/scripts/database.js - código para extração desses dados para csv: https://github.com/belisards/coronabr - réplica dos dados no Kaggle: https://www.kaggle.com/unanimad/corona-virus-brazil [solicita-se publicar uma visualização atualizada desses dados históricos] - Outros agregadores de dados: - https://labs.wesleycota.com/sarscov2/ [Traz informações por municípios!] ![](https://i.imgur.com/aKT0XYB.png) - https://covid19br.github.io/index.html - Dados do Distrito Federal: https://salasit.saude.df.gov.br/lista-de-uti/ - Desejos de conjuntos de dados: - datasets sobre testes para o coronavírus: números, distribuição, produção, linha histórica, etc. - geolocalização mais precisa dos casos do que apenas por estado: micro-região, município, hospital de teste? - medidas de contingência já adotadas por estados e municípios: suspensão de aulas, aglomeração de pessoas, atividades comerciais, etc. - distribuição de leitos de UTI e equipamentos de ventilação para entubamento nos hospitais brasileiros ### Internacional Nosso foco está em dados brasileiros, mas pode ser relevante analisar como nossos dados estão sendo publicados no exterior e comparar nossa evolução com a de outros países. * Base de dados de pesquisa aberta da Casa Branca (USA) à COVID-19 (CORD-19): https://pages.semanticscholar.org/coronavirus-research - Data Repository by Johns Hopkins CSSE (agregador de diversas outras fontes): https://github.com/CSSEGISandData/COVID-19 - Relatórios oficiais diários da OMS: https://www.who.int/emergencies/diseases/novel-coronavirus-2019/situation-reports [falta individualizar as fontes dos dados tabulares utilizados nos relatórios] - Ciência aberta sobre coronavírus (Oxford): https://ourworldindata.org/coronavirus ## Modelos publicados Ainda há poucas publicações de modelos preditivos bem documentados. Por enquanto, o Estado e a mídia contentam-se em divulgar alguns poucos números e previsões não fundamentadas. Para podermos avaliar a qualidade dos modelos e melhorá-los precisamos submetê-los a ampla crítica dos inúmeros cientistas interessados na sociedade - **Modelo SIR (Suscetíveis-Infectados-Removidos)** - matéria detalhada: https://m.tecmundo.com.br/ciencia/151189-quantos-morrer-coronavirus-brasil-cientistas-respondem.htm - código disponível: https://github.com/wlyra/covid19/blob/master/covid19.ipynb ![](https://i.imgur.com/UYNmtbF.png) - Filtro de Kalman para prever número de casos do dia seguinte: https://covid.monitaur.ai/ Por enquanto só tem dados para estados americanos, mas como tem código associado, poderia ser adaptado para dados brasileiros - Simulador de propagação epidêmica: https://www.washingtonpost.com/graphics/2020/world/corona-simulator/ - Modelagem epidemiológica em geral: https://blogdoricardomm.blogspot.com/2020/03/a-matematica-da-epidemia.html ## Visualizações de dados Colacionar tanto visualizações bem feitas, divulgar código para construir tais visualizações, como sugerir possíveis visualizações relevantes ainda não desenvolvidas ou publicadas. Podemos assim construir uma lista de desejos de visualizações úteis que podem guiar os esforços dos desenvolvedores do grupo e priorizar a obtenção de novas bases de dados. - Mapa mundial de casos (Johns Hopkins): https://gisanddata.maps.arcgis.com/apps/opsdashboard/index.html#/bda7594740fd40299423467b48e9ecf6 - Mapa mundial de casos (Bing): http://bing.com/covid Algumas sugestões iniciais: - linha histórica da evolução do número de casos identificados no Brasil, a partir dos dados do MS - comparação da linha de evolução com a de outros países: ![Sem fonte identificada](https://i.imgur.com/xC8S7Gj.jpg) ![fonte geral, mas sem o Brasil](https://i.imgur.com/YccjBLF.jpg) - mapa de calor da densidade de casos no Brasil. O MS já publica um mapa do Brasil com o número de casos por estado. Seria interessante ter um mapa assim com a proporção de infectados em relação à população do estado, que pode ser mais informativo na comparação entre estados do que números absolutos ## Notícias As notícias destacadas aqui precisam fazer referência seja a uma fonte de dados ou a algum modelo que não tenha ainda sido indexado nas seções anteriores, para guiar nossos esforços de publicação, contactando os responsáveis pelos dados/modelos - Guedes: cálculos do BC mostram contágio do Coronavírus no Brasil em escala maior do que China e Itália: https://revistaforum.com.br/noticias/guedes-calculos-do-bc-mostram-contagio-do-coronavirus-no-brasil-em-escala-maior-do-que-china-e-italia/ [Obter acesso ao estudo do Banco Central: analisar fontes e metodologia] - Influência da temperatura e humidade na transmissão do coronavírus: High Temperature and High Humidity Reduce the Transmission of COVID-19 by Jingyu... This paper investigates how air temperature and humidity influence the transmission of COVID-19. https://papers.ssrn.com/sol3/papers.cfm?abstract_id=3551767 ## Projetos colaborativos - **Desafio Enap COVID-19**, tema Tecnologia: Como podemos usar a ciência de dados e/ou a tecnologia para identificar, informar, prever e monitorar a epidemia? https://desafios.enap.gov.br/?page_id=32 - http://crowdfightcovid19.org/ - Inovação aberta: https://pt.surveymonkey.com/r/100OSCovid-19 - Edital de pesquisa da FAPESP: http://www.fapesp.br/14087 - Mapeamento colaborativo de casos: https://www.brasilsemcorona.com.br/