# Exploración de indicadores que reflejen la incidencia de Covid-19 en Venezuela usando fuentes de datos no oficiales.
# Resumen
El objetivo principal de este trabajo es hacer una comparación mediante series de tiempo correspondientes al periodo comprendido entre el marzo de 2020 y mayo de 2021 entre datos numéricos oficiales del virus COVID-19 en Venezuela y datos no oficiales extraídos de las plataformas de GoFundMe, Twitter y Google Trends. Tomaremos como datos oficiales los reportados por el Instituto de Métricas y Evaluación de la Salud (IHME, por sus siglas en inglés), ya que según estimaciones de organizaciones nacionales e internacionales las cifras oficiales no corresponden a la realidad. Por medio del análisis de los datos extraídos, se muestran los mejores indicadores que refeljan la incidencia de Covid-19 en Venezuela. Python es el lenguaje de programación utilizado para extraer, almacenar, visualizar y analizar estos resultados, los cuales van a permitir tener una idea de la realidad que se está viviendo en Venezuela con respecto al virus.
## Introducción
A un año del inicio de la pandemia de COVID-19, sigue avanzando por todo el mundo con millones de muertos e infectados. El IHME, centro de investigación de salud global independiente de la Universidad de Washington, señala que hay falta de información y anomalías de informes presentes en las estadísticas del virus que se informan a diario \cite{IHME}. En Venezuela la situación es mucho peor, la actual crisis que vive, las pocas pruebas confirmatorias que se han realizado por millón de habitantes y la posible manipulación de los datos han generado la incertidumbre en torno al número real de casos \cite{DW}.
Actualmente, el impacto de internet y las redes sociales nos facilita la interacción a nivel mundial, y debido a esto se puede usar minería de datos y valerse de esta valiosa herramienta para extraer información relevante para su posterior análisis, y así estimar la incidencia del virus en Venezuela.
Por un lado, como se mencionó anteriormente, la crisis en Venezuela en todos los sectores, especialmente en el de salud, ha llevado al venezolano a la necesidad de pedir ayuda económica externa para poder adquirir suministros y atención médica. Una de las plataforma de preferencia es GoFundMe \cite{GFM}, esto se evidencia en las redes sociales donde se encuentran numerosas campañas de ayuda. Por otro lado, la red social Twitter \cite{Tw} es una fuente importante para el marketing, los negocios y la investigación, muchas personas expresan por medio de ellos estados, sentimientos y opiniones sobre cualquier tema, y parte de esta data se puede obtener por medio de las interfaces de programación de aplicaciones (API, por sus siglas en inglés) \cite{W}, las cuales facilitan la extracción de cualquier información que sea pública en tiempo real y a través de la historia en Twitter.
Por último, diariamente hay miles de solicitudes a los buscadores web para encontrar información sobre cualquier tema, hoy en día Google Trend \cite{GT} permite el acceso a una muestra significativa que representa las tendencias desde el año 2004 hasta 36 horas antes de la búsqueda; los datos son anónimos y aunque solo se utiliza una muestra de las búsquedas \cite{sGT}, permite hacer un análisis confiable, ya que se gestionan millones de búsquedas diariamente.
El presente trabajo se divide en 4 secciones. La primera corresponde al análisis de los datos obtenidos de la webscraping de GoFundMe. En la segunda y tercera sección se trabaja la obtención y análisis de las publicaciones de Twitter y las tendencias de búsqueda de Google Trend, respectivamente. Finalmente, se hace un análisis comparativo de los resultados obtenidos con los datos presentados por el IHME.
## Datos
### IHME
A finales de enero de 2021, el IHME lanza un nuevo modelo para el pronostico de COVID-19, éste toma en consideración tres métricas: infecciones, hospitalización de infecciones, y muertes de infecciones. A partir de ellas, genera una estimación sobre el número de infecciones, también toma en consideración las estadísticas de seroprevalencia y utiliza métodos para predecir la tasa de detección de infectados (IDR), la tasa de infección-hospitalización (IHR) y la tasa de infección-letalidad (IFR) en entornos sin encuestas de seroprevalencia. Mayores detalles del modelo de IHME se pueden encontrar en \cite{mIHME}.
Los datos se decargaron de la página de OurWorldInData el 11 de mayo de 2021 \cite{OWD}, quienes toman como referencia los datos del IHME. Otros modelos, el ICL (Imperial College London) y el LSHTM (The London School of Hygiene & Tropical Medicine), por ejemplo, asumen que el número de muertes confirmadas es igual al número real, en Venezuela, éste no es el caso, como mencionamos anteriormente, y por lo tanto, subestiman los valores reales. El modelo YYG (Youyang Gu) fue creado y optimizado para EE.UU, para otros países las estimaciones del modelo pueden ser menos precisas. El modelo IHME se ajusta más a la realidad, adicionalmente, se sigue actualizando continuamente desde sus inicios hasta la actualidad.
La Figura \ref{Figura1} muestra gráficas de series de tiempo de los datos dados por Our Word in Data para Venezuela, quienes también proveen los datos oficiales del gobierno de Venezuela. Los casos confirmados de infectados representan entre el ($18\%$) al ($24\%$) de los casos estimados por IHME. El comportamiento cualitativo de los picos de infecciosos concuerdan tanto en los casos reportados como estimados, aunque las franjas de incertidumbre ($95\%$) de las estimaciones son mucho más grande en estos picos.
### GoFoundme
GoFundMe, la popular plataforma de *crowdfunding*, se ha convertido en una forma de financiación alternativa para familias con gastos médicos que son incapaces de asumir por cuenta propia [11-15]. La crisis causada por la pandemia de Covid-19 dentro de la coyuntura social y económica que atraviesa Venezuela ha provocado que muchas personas vean en esta plataforma una forma de recaudar dinero para suplir los gastos médicos de sus seres queridos [11]. En este orden de ideas, se propone que el incremento en el número de campañas en GoFundMe se correlaciona con el número de casos de coronovirus en Venezuela.
#### Extracción de datos y *Webscraping* de los datos de GoFundMe
Los datos sobre las campañas de GoFundMe son producto de una colaboración con Harvey Maddocks y pueden encontrarse en [9]. Estos datos fueron colectados mediante técnicas de *webscrapping*. A continuación, se expondrán brevemente los pasos que se siguieron en este procedmiento:
1. Como es común en muchos sitios web, GoFundMe tiene un motor de búsqueda interno que permite al usuario consultar campañas de *crowfunding* a partir de palabras clave. Para usar esta herramienta de la mejor manera posible, se propusieron las palabras clave que nos pudieran conducir al mayor número de campañas de interés. En nuestro caso, las palabras usadas fueron: *Venezuela*, *Covid*.
2. Ahora, usando el formato de url del sitio web de GoFundMe, se crea la dirección correspondiente a la primera página de la búsqueda de las palabras clave escogidas en el punto anterior.
3. Posteriormente, usando el navegador virtual *Selenium*, compatible con el lenguaje de programación *python*, fue posible acceder a la página web de GoFundMe usando la url creada en el punto anterior. Esta herramienta permite además extraer el archivo HTML correspondiente a las páginas web.
4. Luego, se utilizó la biblioteca *Beautiful soup* para extraer los datos de los archivos HTML de las páginas web. Por ejemplo, al usar esta función sobre las páginas del resultado de búsqueda, se pudo crear una lista con todas las direcciones url de los sitios de las campañas que aparecían como resultado.
5. Entonces, usando las bibliotecas *Selenium*, para acceder a las páginas web de las campañas, y *Beautiful soup*, para colectar datos; se recorrió la lista de direcciones url y se extrayeron los datos de interés para cada una de las campañas en esta página. En nuestro caso, la información que se colectó de cada campaña fue:
* La dirección *url* de la página donde se encuentra alojada la campaña.
* El *título* de la campaña.
* las *etiquetas (tags)*, o la categoria a la que pertence cada la campaña.
* El *monto actual* recaudado por la campaña.
* El *monto total* a recaudar o meta de recaudación.
* La *descripción* de la campaña
* La *fecha de lanzamiento*
* El *país de origen* de la campaña.
* El número de donaciones que ha recibido la campaña.
* Y un columna indicando si la campaña se trata de caridad o no.
Estos datos se iban añadiendo, campaña a campaña en una tabla de tal forma que cada fila era una campaña diferente.
6. Por último, se itera este procedimiento sobre todas las páginas del resultado de búsqueda de las palabras clave selecionadas
#### Limpieza de datos y tratamiento ético de información privada:
Como se menciona en la sección anterior, del proceso de *webscrapping* se obtuvo una tabla con 11 columnas, en donde cada una de las 2042 filas contenía la información de una campaña. Los nombre de las columnas, que corresponde cada una a una de las variables mencionadas en el punto anterior son, respectivamente:
`url, title, tags, current amount, total_amount, description, created, launch_date, country, donation_count, is_charity.`
Ahora bien, antes de realizar el análisis, la tabla de datos crudos pasó por un proceso de limpieza. A continuación se describirá brevemente las estapas del proceso de limpieza:
1. Se garantizó que todas la variables estuvieran en el formato adecuado. Por ejemplo, no aseguramos que la columna `launch_date` (fecha de lanzamiento) estuvise, en formato de fecha; o que la columna `donation_count`(recuento de donaciones) tenga formato numérico.
2. Se seleccionaron datos cuya fecha sea posterior al q de enero del 2020.
3. Luego, por motivos éticos, se eliminaron de la tabla de datos las columnas que ponian en riesgo la privacidad de las personas que lanzaron la campañas o la de sus familiares: `url`, `title`, `description`.
4. Por último, al considerar que en las columnas `donation_count` y `current_amount` el dinero se expresa en la en monedas diferentes se implementaron rutinas con las que se pudo:
* Colocar el valor numérico del dinero y el tipo de moneda usada en columnas diferentes.
* Se añadieron dos columnas `current amount in dollars` y `total amount in dollars`, en donde se transformaron todos los montos monetarios a dólares. En este paso usamos la biblioteca *currency converter*.
* Aprovechando que las entradas en `current amount in dollars` y `total amount in dollars` entre todas las campañas son comparables, se agregó una columna: `percentage of completion`, la cual cuantifica cuanto ha avanzado la campaña en términos monetarios.
#### Análisis exploratorio de los datos de GoFundMe
Para entender mejor los datos de GoFundMe se hicieron gráficas en donde se puede observar la distribución de las variables más relevantes. Por un lado, según los datos obtenidos mediante *webscraping*, se observa que todas las campañas provienen de estados unidos (figura 1). Sin embargo, al considerar la distribución de monedas (figura 2) vemos que muy probablemente los método de *webscrapping* implementados no son adecuados para identificar el país de procedencia de las campañas, ya que existe una proporción no despreciable de resultados usan euros como divisa. Las otras monedas, las cuales se usaron minoritariamente, también podrían indicar que las campañas se abrieron en más países. Estas monedas fueron: libra esterlina, franco suizo y corona sueca. Ahora bien, a pesar de la probable presencia de otros paises, es innegable que la gran mayoría de campañas utilizan dólares como moneda, lo que estaría confirmando que la gran mayoría de campañas vendrían de Estados Unidos.
Por otra parte, vemos que, domo el covid es una enfermedad, no es sorpresa que la inmensa mayoría de campañas que concuerdan con las palabras de búsqueda: *Venezuela, Covid* estén en la categoría: `Medical, Illness and Healing`. Sin embargo debe considerarse que, al hacer una revisión manual se encontró que no todas las campañas que estaban en esta sección se hallaban directamente relacionadas a casos de covid-19. Adicionalmente, entre los datos habían campañas que sí estaban relacionadas a casos de covid-19 bajo otros tags, por ejemplo `Accidents & Emergencies` , lo cual representa un limitación en este trabajo. Este tipo de discrepancias y ambiguedades que se encuentran en los datos nos motivan a pensar que la incorporación de técnicas de minería de textos podrían ser útiles para identifcar las campañas de asociadas directamente a casos de covid-19, lo que permitiría la construcción de un indicador más robusto.
A su vez, en las distribuciones de las variables numéricas: monto actual, monto total, porcentaje de avance y recuento de donaciones (figuras 6-7); se encontró en todos los casos una asimetría positiva con una moda muy cercana a cero y la presencia de algunas campañas con valores relativamente altos para las variables que se distribuyen. Para el número campañas lanzadas diariamente, la suma de las campañas lanzadas diariamente y el valores promedio de las campañas que se lanzan diariamente, se construyeron series de tiempo. En las figuras 7-9, se presentan las series de tiempo para estas variables, para 3 subconjutos distintos:
* Todas los campañas.
* Las campañas con las etiquetas: `Medical, Illnes & Healing`.
* Las campañas con las etiquetas: `Accidents & Emergencies`.
* La unión de los dos subconjutos anteriores: `Medical, Illnes & Healing + Accidents & Emergencies`
Como se buscan indicadores que reflejen el estado de la pandemia, los dos candidatos evidentes serían el número de campañas lanzadas diariamente y la suma del valor de las campañas lanzadas diariamente. Sin embargo, esta última variable presenta un problema, ya que las fluctuaciones en el valor promedio de las campañas, el cual parece estar no guardar correlación con el número de casos (comparar las estimaciones del IHME con la figura (9)) influye mucho en el esta variable, lo cual estaría generando un ruido adicional que dificultaría la detección eficaz de picos epidemiológicos. Por último, entre los 4 subconjuntos que se presentan, se observa que los datos de la categoría `Medical, Illnes & Healing` son los que guardarían una mejor correlación con el número de casos de la pandamia en venezuela. Por tal motivo, escogemos solamente a este subconjuto como indicador.
"""
Incluir gráficas en el documento final:
graficos de barras:
- Distribución de paises (figura 1)
- Distribución de monedas (figura 2)
- Distribución de tags (figura 3)
histogramas:
- Distribución de monto actual y total en dólares (figura 4)
- Distribución del porcentaje de avance (figura 5)
- Distribución del recuento de donaciones (figura 6)
Series de tiempo:
- Número de campañas lanzadas diariamente (figura 7).
- Suma del valor de las campañas lanzadas diariamente (figura 8).
- Valor promedio de las campañas lanzadas diariamente (figura 9).
"""
### Twitter
Los datos de Twitter se obtienen con el uso de una API dedicada que provee los tweets públicos del archivo completo de Twitter (desde marzo 2006). La API permite hacer búsquedas relacionadas a palabras claves y operadores que hacen coiincidir unos atributos al tweet.
La consulta está comprendida entre marzo de 2020 hasta el 10 de mayo de 2021, ésta coincide con con las palabras claves:
- covid-19 / coronavirus
- infectado covid-19
- muerte covid-19
- (bombona/flujómetro/saturación) de oxígeno
- dexametasona
- GoFundMe venezuela covid-19
- recolectar dinero
- ayuda covid-19
- tratamiento covid-19
- UCI covid-19
- servicio público covid-19
Las consultas se especificaron con y sin hastahtag(\#), ya que con este operador se realiza una coincidencia exacta; las palabras claves se especificaron con y sin tilde diacrítica, debido a que hay distinción entre las palabras que la posean y las que no, no obstante, no se hace distinción entre mayúsculas y minúsculas. Se filtraron todos aquellos tweets que eran retweets y, posteriormente, se eliminaron los repetidos. Adicionalmente, la búsqueda de todas las palabras claves, a excepción de las relacionadas con "GoFundMe", se hizo local, es decir, se restringió la búsqueda al país \cite{mbTw}.
Los operadores en la búsqueda son:
- -is:retweet. Negación del operador is:retweet, usada para buscar solo tweets originales.
- OR. Conjunción (o), implica que los tweets coincidirán si cumple alguna de las condiciones.
- place_country:VE. Usada para obtener tweets proveniente del país Venezuela.
- has link. Con link adjunto.
Las consultas con los operadores place\_country$:$VE y -is$:$retweet son:
- ``covid-19 OR coronavirus''
- ``infectado covid-19 OR muerte covid-19''
- ``oxígeno OR dexametasona''
- ``bombona de oxígeno OR dexametasona''
- ``flujómetro de oxígeno OR saturación de oxígeno''
- ``flujometro de oxigeno OR saturacion de oxigeno''
- ``\#flujmetroOxigeno OR \#saturacionOxigeno ''
- ``recolectar dinero covid-19 OR ayuda covid-19''
- ``\#RecolectarDinero covid-19 OR #\ayuda covid-19''
- ``#ServicioPúblico covid-19''
- ``#ServicioPublico covid-19''
- ``servicio público covid-19 OR servicio publico covid-19''
- ``ServicioPublico covid-19 OR ServicioPúblico covid-19''
- ``servicio publico OR servicio publico''
- ``UCIS OR unidad de cuidados intensivos''
- ``#UCIS ''
- ``tratamiento covid-19''
Las consultas con el operador has link son:
- ``GoFundMe venezuela covid-19 OR GoFundMe venezuela covid-19''
- ``\#GoFundMe venezuela covid-19 OR \#GoFundMe venezuela covid-19''
El Notebook que contiene todo el código utilizado para la extracción de datos de Twitter se puede conseguir en \cite{NoTwD}.
Las políticas y acuerdos para desarrolladores de las API de Twitter \cite{pTw}, señalan que se permite hacer análisis de su contenido siempre y cuando no se almacenen y presenten datos personales, dedido a esto, de toda la infomación que se recauda, se presenta solo la correspondiente al cuerpo del twitter ``text'' y la fecha de publicación ``created\_ad''.
La consulta de las palabras ``covid-19'' y ``coronavirus'', es la que más tweets da por día, tan solo para el primer día del periodo arrojó 430 tweets, sin embargo, se descarta debido a que estos tweets están relacionado a cualquier noticia o comentarios sobre el COVID-19 desde el inicio de la pandemia, no necesariamente sobre infectados.
El resto de consultas se divide en 6 grupos, con un total de tweets recaudados de 3307. (ver Tabla \ref{Tabla1}).
<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<
la siguiente información va en tabla con una columna adicional de los tweets recaudados: 365 al grupo 1, 295 al grupo 2, 757 al grupo 3, 1409 al grupo 4, 77 al grupo 5 y 325 al grupo 6.
1. Grupo 1
- infectado covid-19
- muerte covid-19
2. Grupo 2
- bombona de oxígeno
- flujometro de oxígeno
- saturación de oxígeno
- dexametasona
3. Grupo 3
- GoFundMe venezuela covid-19
- recolectar dinero covid-19
- ayuda covid-19
4. Grupo 4
- servicio público
5. Grupo 5
- UCI
- unidad de cuidados intensivos.
6. Grupo 6
- tratamiento covid-19
<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<
Inicialmente, se hizo la consulta sobre la palabra ``oxígeno'', la cual no fue un buen indicador; ésta fue cambiada por ``bombona/flujómetro/saturación de oxígeno''. ``GoFundMe venezuela covid-19'' con el operador 'has link' arroja en su mayoría todos los tweets que son de campañas de apoyo para enfermos de COVID-19. Esta consulta no se hizo en el país Venezuela debido a que es muy difícil abrir una campaña sin tener una cuenta en el exterior \cite{CC}.
Las consultas relacionadas a ``servicio público covid-19'' fue la que más tweets arrojó, se esperaba que el número de publicaciones en la franja de abril/mayo de 2021, donde se encuentra el pico más alto de infecciones, según el modelo IHME, fuera más alto, ya que en Venezuela se suele usar la palabra clave ``servicio público'' para ayudas médicas en redes sociales. El Notebook que contiene todo el código utilizado para el análisis y la construcción de las series de tiempo de los datos extraídos de Twitter se puede conseguir en \cite{NoTwA}.
### Google trends
Las consultas se hacen por medio de pytrend, una API no oficial de Google Trend que permite una interfaz simple para automatizar los informes de descargas \cite{pytrend}. Entre los métodos que provee se pueden encontrar: interés a lo largo de tiempo, interés histórico por horas, interés por región, tendencias de búsqueda, consultas relacionados, etc. Utiliza parámetros tales como: palabras claves, categorías, país, tiempo y grupos (imágenes, noticias, etc.).
Las palabras claves utilizadas son: ``oxígeno'', ``GoFundMe'', ``ayuda económica'', ``servicio público'', ``tratamiento covid-19'' y ``dexametasona''. Éstas se especificaron con y sin tilde diacrítica, arrojando distintos resultados en ambos casos, sin embargo, no hay distinción entre mayúsculas y minúsculas. Todas las búsquedas se hicieron en el país Venezuela y en el intervalo de tiempo de 15 de mayo de 2020 hasta 15 de mayo de 2021.
Los tipos de solicitudes que se hacen son 'related\_queries' y 'interest\_over\_time'; las cuales muestran, respectivamente, las búsquedas relacionadas a las palabras claves, donde se les asocian valores en una escala del 0 al 100. El número 100 le corresponde a la tendencia más alta y a medida que va disminuyendo el número, va disminuyendo la tendencia. Finalmente, muestra una serie de tiempo que nos muestra el cambio de popularidad con el tiempo; los valores representan el interés de búsqueda relativo al punto más alto en el gráfico, siendo 100 el pico de popularidad.
El Notebook que contiene todo el código utilizado para la extracción de los datos de Google Trends se puede consueguir en \cite{NoGT}.
## Análisis de resultados
Las gráficas de serie de tiempo de los tres conjuntos de datos extraídos muestran similitud con el comportamiento del modelo IHME, por lo tanto, como se mencionó anteriormente, el análisis comparativo toma como referencia este modelo, sin tomar en cuenta los datos reportados por el gobierno de Venezuela.
La Figura \ref{Figura1} muestra cómo las campañas de GoFundMe aumentaron considerablemente en abril de 2021, coincidiendo con el pico más alto de infecciosos que estima el modelo IHME. Esto evidencia que el número de campañas aumentan a medida que el número de infectados crece, siendo un buen indicador para la incidencia del virus.
En la Figura \ref{Figura3} se observa un comportamiento irregular a lo largo de la pandemia, sin embargo, se puede notar que en septiembre de 2020 existe un número de publicaciones considerablemante más alto que en otras fechas. También tenemos un incremento notable en agosto de 2020 y abril de 2021. En comparación con la serie de tiempo base, los picos están en las mismas fechas, pero en distinta proporción.
Las búsquedas más significativas y los valores que se acercan más a los datos aportados por el IHME fueron las palabras: ``oxigeno''(sin tilde), ``GoFundMe'', ``tratamiento covid'' y``dexametasona''. En la Tabla \ref{Tabla2} y Figura \ref{Figura3} se muestran las búsquedas relacionadas y las series de tiempo de cada palabra, respectivamente. El interés del público en palabras claves asociadas al COVID-19, es un buen indicador para estimar la magnitud del virus en Venezuela.
## Discusión de los resultados
Our World in Data provee, entre otras cosas, un modelo que estima el número real de infectados de COVID-19 en Venezuela (IHME) y el número de infectados reportados por el gobierno. Al analizar las gráficas de series de tiempo de estos datos y la de los datos extraídos de las distintas plataformas, se observa que hay dos puntos críticos en septiembre de 2020 y mayo de 2021. Sin embargo, el número de infectados reportados por el gobierno de Venezuela no muestra el incremento abrupto en estos picos, reforzando la teoría de que las cifras dadas por el gobierno de Venezuela no son reales.
En Venezuela, tanto el número de campañas de GoFundMe y el interés público sobre las palabras claves de covid-19, tienen un pico muy pronunciado en abril de 2021, éstos se relacionan con el número de casos reales de COVID-19 estimados en Venezuela por el modelo del IHME. Por otro lado, las publicaciones de Twitter relacionadas al COVID-19 aumentan a medida que incrementa el número de infectados reales estimados.
A modo de conclusión, internet es un medio para buscar y difundir información, ofreciendo información que se puede utilizar para identificar enfermedades y estimar tasas de incidencias a lo largo del tiempo. Si se hace un estudio más exhaustivo, podrían ser una fuente de información clave para predecir o detectar incidencias de brotes en la humanidad.
- Discutir cuales eran los mejores indicadores
- Discutir el impacto que puede tener tener otros indicadores cuando la información es escasa, y como esto podría expanderse a otros paises.
- Cosas que podrían hacerese en el futuro con estos datos
## Referencias
[1] http://www.healthdata.org/special-analysis/covid-19-estimating-historical-infections-time-series
[2] https://www.dw.com/es/la-pandemia-en-venezuela-manipulaci%C3%B3n-de-la-informaci%C3%B3n-cementerios-llenos-y-a%C3%BAn-sin-plan-de-vacunaci%C3%B3n/a-57258234
[3] Twitter. Es lo que está pasando.https://twitter.com
[4] ttps://es.wikipedia.org/wiki/Interfaz_de_programaci%C3%B3n_de_aplicaciones
[5] https://trends.google.es
[6] https://support.google.com/trends/answer/4365533?hl=es
[7] Friedman J, Liu P, Troeger CE, Carter A, Reiner RC, Barber RM, Collins J, Lim SS, Pigott DM, Vos T, Hay SI, Murray CJL, Gakidou E. Predictive performance of international COVID-19 mortality forecasting models. Nature Communications. 10 May 2021. doi: 10.1038/s41467-021-22457-w.
[8] https://ourworldindata.org/grapher/daily-new-estimated-covid-19-infections-ihme-model?country=~VEN
[9] https://github.com/HarveyMaddocks/gofundme_webscraper
[10] notebook de GoFundMe
[11] https://www.caracaschronicles.com/2021/04/15/gofundme-venezuelans-lifesaver-against-covid-19/
[12] https://www.ncbi.nlm.nih.gov/pmc/articles/PMC3273528/
[13] https://www.businessinsider.com/gofundme-being-used-for-medical-costs-is-bad-sign-for-us-healthcare-2019-1
[14] https://www.forbes.com/sites/carolynmcclanahan/2018/08/13/using-gofundme-to-attack-health-care-costs/?sh=26aeb3812859
[15] https://www.huffpost.com/entry/gofundme-health-care-system_n_5ced9785e4b0ae6710584b27
[16] https://developer.twitter.com/en/docs/twitter-api/tweets/search/integrate/build-a-query#examples
[17] notebook de Twitter
[18] https://developer.twitter.com/en/developer-terms
[19] notebook de Twitter
[20] https://pypi.org/project/pytrends/
[21] notebook google trends