Camila Rangel Smith
    • Create new note
    • Create a note from template
      • Sharing URL Link copied
      • /edit
      • View mode
        • Edit mode
        • View mode
        • Book mode
        • Slide mode
        Edit mode View mode Book mode Slide mode
      • Customize slides
      • Note Permission
      • Read
        • Only me
        • Signed-in users
        • Everyone
        Only me Signed-in users Everyone
      • Write
        • Only me
        • Signed-in users
        • Everyone
        Only me Signed-in users Everyone
      • Engagement control Commenting, Suggest edit, Emoji Reply
    • Invite by email
      Invitee

      This note has no invitees

    • Publish Note

      Share your work with the world Congratulations! 🎉 Your note is out in the world Publish Note

      Your note will be visible on your profile and discoverable by anyone.
      Your note is now live.
      This note is visible on your profile and discoverable online.
      Everyone on the web can find and read all notes of this public team.
      See published notes
      Unpublish note
      Please check the box to agree to the Community Guidelines.
      View profile
    • Commenting
      Permission
      Disabled Forbidden Owners Signed-in users Everyone
    • Enable
    • Permission
      • Forbidden
      • Owners
      • Signed-in users
      • Everyone
    • Suggest edit
      Permission
      Disabled Forbidden Owners Signed-in users Everyone
    • Enable
    • Permission
      • Forbidden
      • Owners
      • Signed-in users
    • Emoji Reply
    • Enable
    • Versions and GitHub Sync
    • Note settings
    • Note Insights New
    • Engagement control
    • Make a copy
    • Transfer ownership
    • Delete this note
    • Save as template
    • Insert from template
    • Import from
      • Dropbox
      • Google Drive
      • Gist
      • Clipboard
    • Export to
      • Dropbox
      • Google Drive
      • Gist
    • Download
      • Markdown
      • HTML
      • Raw HTML
Menu Note settings Note Insights Versions and GitHub Sync Sharing URL Create Help
Create Create new note Create a note from template
Menu
Options
Engagement control Make a copy Transfer ownership Delete this note
Import from
Dropbox Google Drive Gist Clipboard
Export to
Dropbox Google Drive Gist
Download
Markdown HTML Raw HTML
Back
Sharing URL Link copied
/edit
View mode
  • Edit mode
  • View mode
  • Book mode
  • Slide mode
Edit mode View mode Book mode Slide mode
Customize slides
Note Permission
Read
Only me
  • Only me
  • Signed-in users
  • Everyone
Only me Signed-in users Everyone
Write
Only me
  • Only me
  • Signed-in users
  • Everyone
Only me Signed-in users Everyone
Engagement control Commenting, Suggest edit, Emoji Reply
  • Invite by email
    Invitee

    This note has no invitees

  • Publish Note

    Share your work with the world Congratulations! 🎉 Your note is out in the world Publish Note

    Your note will be visible on your profile and discoverable by anyone.
    Your note is now live.
    This note is visible on your profile and discoverable online.
    Everyone on the web can find and read all notes of this public team.
    See published notes
    Unpublish note
    Please check the box to agree to the Community Guidelines.
    View profile
    Engagement control
    Commenting
    Permission
    Disabled Forbidden Owners Signed-in users Everyone
    Enable
    Permission
    • Forbidden
    • Owners
    • Signed-in users
    • Everyone
    Suggest edit
    Permission
    Disabled Forbidden Owners Signed-in users Everyone
    Enable
    Permission
    • Forbidden
    • Owners
    • Signed-in users
    Emoji Reply
    Enable
    Import from Dropbox Google Drive Gist Clipboard
       Owned this note    Owned this note      
    Published Linked with GitHub
    • Any changes
      Be notified of any changes
    • Mention me
      Be notified of mention me
    • Unsubscribe
    # Exploración de indicadores que reflejen la incidencia de Covid-19 en Venezuela usando fuentes de datos no oficiales. # Resumen El objetivo principal de este trabajo es hacer una comparación mediante series de tiempo correspondientes al periodo comprendido entre el marzo de 2020 y mayo de 2021 entre datos numéricos oficiales del virus COVID-19 en Venezuela y datos no oficiales extraídos de las plataformas de GoFundMe, Twitter y Google Trends. Tomaremos como datos oficiales los reportados por el Instituto de Métricas y Evaluación de la Salud (IHME, por sus siglas en inglés), ya que según estimaciones de organizaciones nacionales e internacionales las cifras oficiales no corresponden a la realidad. Por medio del análisis de los datos extraídos, se muestran los mejores indicadores que refeljan la incidencia de Covid-19 en Venezuela. Python es el lenguaje de programación utilizado para extraer, almacenar, visualizar y analizar estos resultados, los cuales van a permitir tener una idea de la realidad que se está viviendo en Venezuela con respecto al virus. ## Introducción A un año del inicio de la pandemia de COVID-19, sigue avanzando por todo el mundo con millones de muertos e infectados. El IHME, centro de investigación de salud global independiente de la Universidad de Washington, señala que hay falta de información y anomalías de informes presentes en las estadísticas del virus que se informan a diario \cite{IHME}. En Venezuela la situación es mucho peor, la actual crisis que vive, las pocas pruebas confirmatorias que se han realizado por millón de habitantes y la posible manipulación de los datos han generado la incertidumbre en torno al número real de casos \cite{DW}. Actualmente, el impacto de internet y las redes sociales nos facilita la interacción a nivel mundial, y debido a esto se puede usar minería de datos y valerse de esta valiosa herramienta para extraer información relevante para su posterior análisis, y así estimar la incidencia del virus en Venezuela. Por un lado, como se mencionó anteriormente, la crisis en Venezuela en todos los sectores, especialmente en el de salud, ha llevado al venezolano a la necesidad de pedir ayuda económica externa para poder adquirir suministros y atención médica. Una de las plataforma de preferencia es GoFundMe \cite{GFM}, esto se evidencia en las redes sociales donde se encuentran numerosas campañas de ayuda. Por otro lado, la red social Twitter \cite{Tw} es una fuente importante para el marketing, los negocios y la investigación, muchas personas expresan por medio de ellos estados, sentimientos y opiniones sobre cualquier tema, y parte de esta data se puede obtener por medio de las interfaces de programación de aplicaciones (API, por sus siglas en inglés) \cite{W}, las cuales facilitan la extracción de cualquier información que sea pública en tiempo real y a través de la historia en Twitter. Por último, diariamente hay miles de solicitudes a los buscadores web para encontrar información sobre cualquier tema, hoy en día Google Trend \cite{GT} permite el acceso a una muestra significativa que representa las tendencias desde el año 2004 hasta 36 horas antes de la búsqueda; los datos son anónimos y aunque solo se utiliza una muestra de las búsquedas \cite{sGT}, permite hacer un análisis confiable, ya que se gestionan millones de búsquedas diariamente. El presente trabajo se divide en 4 secciones. La primera corresponde al análisis de los datos obtenidos de la webscraping de GoFundMe. En la segunda y tercera sección se trabaja la obtención y análisis de las publicaciones de Twitter y las tendencias de búsqueda de Google Trend, respectivamente. Finalmente, se hace un análisis comparativo de los resultados obtenidos con los datos presentados por el IHME. ## Datos ### IHME A finales de enero de 2021, el IHME lanza un nuevo modelo para el pronostico de COVID-19, éste toma en consideración tres métricas: infecciones, hospitalización de infecciones, y muertes de infecciones. A partir de ellas, genera una estimación sobre el número de infecciones, también toma en consideración las estadísticas de seroprevalencia y utiliza métodos para predecir la tasa de detección de infectados (IDR), la tasa de infección-hospitalización (IHR) y la tasa de infección-letalidad (IFR) en entornos sin encuestas de seroprevalencia. Mayores detalles del modelo de IHME se pueden encontrar en \cite{mIHME}. Los datos se decargaron de la página de OurWorldInData el 11 de mayo de 2021 \cite{OWD}, quienes toman como referencia los datos del IHME. Otros modelos, el ICL (Imperial College London) y el LSHTM (The London School of Hygiene & Tropical Medicine), por ejemplo, asumen que el número de muertes confirmadas es igual al número real, en Venezuela, éste no es el caso, como mencionamos anteriormente, y por lo tanto, subestiman los valores reales. El modelo YYG (Youyang Gu) fue creado y optimizado para EE.UU, para otros países las estimaciones del modelo pueden ser menos precisas. El modelo IHME se ajusta más a la realidad, adicionalmente, se sigue actualizando continuamente desde sus inicios hasta la actualidad. La Figura \ref{Figura1} muestra gráficas de series de tiempo de los datos dados por Our Word in Data para Venezuela, quienes también proveen los datos oficiales del gobierno de Venezuela. Los casos confirmados de infectados representan entre el ($18\%$) al ($24\%$) de los casos estimados por IHME. El comportamiento cualitativo de los picos de infecciosos concuerdan tanto en los casos reportados como estimados, aunque las franjas de incertidumbre ($95\%$) de las estimaciones son mucho más grande en estos picos. ### GoFoundme GoFundMe, la popular plataforma de *crowdfunding*, se ha convertido en una forma de financiación alternativa para familias con gastos médicos que son incapaces de asumir por cuenta propia [11-15]. La crisis causada por la pandemia de Covid-19 dentro de la coyuntura social y económica que atraviesa Venezuela ha provocado que muchas personas vean en esta plataforma una forma de recaudar dinero para suplir los gastos médicos de sus seres queridos [11]. En este orden de ideas, se propone que el incremento en el número de campañas en GoFundMe se correlaciona con el número de casos de coronovirus en Venezuela. #### Extracción de datos y *Webscraping* de los datos de GoFundMe Los datos sobre las campañas de GoFundMe son producto de una colaboración con Harvey Maddocks y pueden encontrarse en [9]. Estos datos fueron colectados mediante técnicas de *webscrapping*. A continuación, se expondrán brevemente los pasos que se siguieron en este procedmiento: 1. Como es común en muchos sitios web, GoFundMe tiene un motor de búsqueda interno que permite al usuario consultar campañas de *crowfunding* a partir de palabras clave. Para usar esta herramienta de la mejor manera posible, se propusieron las palabras clave que nos pudieran conducir al mayor número de campañas de interés. En nuestro caso, las palabras usadas fueron: *Venezuela*, *Covid*. 2. Ahora, usando el formato de url del sitio web de GoFundMe, se crea la dirección correspondiente a la primera página de la búsqueda de las palabras clave escogidas en el punto anterior. 3. Posteriormente, usando el navegador virtual *Selenium*, compatible con el lenguaje de programación *python*, fue posible acceder a la página web de GoFundMe usando la url creada en el punto anterior. Esta herramienta permite además extraer el archivo HTML correspondiente a las páginas web. 4. Luego, se utilizó la biblioteca *Beautiful soup* para extraer los datos de los archivos HTML de las páginas web. Por ejemplo, al usar esta función sobre las páginas del resultado de búsqueda, se pudo crear una lista con todas las direcciones url de los sitios de las campañas que aparecían como resultado. 5. Entonces, usando las bibliotecas *Selenium*, para acceder a las páginas web de las campañas, y *Beautiful soup*, para colectar datos; se recorrió la lista de direcciones url y se extrayeron los datos de interés para cada una de las campañas en esta página. En nuestro caso, la información que se colectó de cada campaña fue: * La dirección *url* de la página donde se encuentra alojada la campaña. * El *título* de la campaña. * las *etiquetas (tags)*, o la categoria a la que pertence cada la campaña. * El *monto actual* recaudado por la campaña. * El *monto total* a recaudar o meta de recaudación. * La *descripción* de la campaña * La *fecha de lanzamiento* * El *país de origen* de la campaña. * El número de donaciones que ha recibido la campaña. * Y un columna indicando si la campaña se trata de caridad o no. Estos datos se iban añadiendo, campaña a campaña en una tabla de tal forma que cada fila era una campaña diferente. 6. Por último, se itera este procedimiento sobre todas las páginas del resultado de búsqueda de las palabras clave selecionadas #### Limpieza de datos y tratamiento ético de información privada: Como se menciona en la sección anterior, del proceso de *webscrapping* se obtuvo una tabla con 11 columnas, en donde cada una de las 2042 filas contenía la información de una campaña. Los nombre de las columnas, que corresponde cada una a una de las variables mencionadas en el punto anterior son, respectivamente: `url, title, tags, current amount, total_amount, description, created, launch_date, country, donation_count, is_charity.` Ahora bien, antes de realizar el análisis, la tabla de datos crudos pasó por un proceso de limpieza. A continuación se describirá brevemente las estapas del proceso de limpieza: 1. Se garantizó que todas la variables estuvieran en el formato adecuado. Por ejemplo, no aseguramos que la columna `launch_date` (fecha de lanzamiento) estuvise, en formato de fecha; o que la columna `donation_count`(recuento de donaciones) tenga formato numérico. 2. Se seleccionaron datos cuya fecha sea posterior al q de enero del 2020. 3. Luego, por motivos éticos, se eliminaron de la tabla de datos las columnas que ponian en riesgo la privacidad de las personas que lanzaron la campañas o la de sus familiares: `url`, `title`, `description`. 4. Por último, al considerar que en las columnas `donation_count` y `current_amount` el dinero se expresa en la en monedas diferentes se implementaron rutinas con las que se pudo: * Colocar el valor numérico del dinero y el tipo de moneda usada en columnas diferentes. * Se añadieron dos columnas `current amount in dollars` y `total amount in dollars`, en donde se transformaron todos los montos monetarios a dólares. En este paso usamos la biblioteca *currency converter*. * Aprovechando que las entradas en `current amount in dollars` y `total amount in dollars` entre todas las campañas son comparables, se agregó una columna: `percentage of completion`, la cual cuantifica cuanto ha avanzado la campaña en términos monetarios. #### Análisis exploratorio de los datos de GoFundMe Para entender mejor los datos de GoFundMe se hicieron gráficas en donde se puede observar la distribución de las variables más relevantes. Por un lado, según los datos obtenidos mediante *webscraping*, se observa que todas las campañas provienen de estados unidos (figura 1). Sin embargo, al considerar la distribución de monedas (figura 2) vemos que muy probablemente los método de *webscrapping* implementados no son adecuados para identificar el país de procedencia de las campañas, ya que existe una proporción no despreciable de resultados usan euros como divisa. Las otras monedas, las cuales se usaron minoritariamente, también podrían indicar que las campañas se abrieron en más países. Estas monedas fueron: libra esterlina, franco suizo y corona sueca. Ahora bien, a pesar de la probable presencia de otros paises, es innegable que la gran mayoría de campañas utilizan dólares como moneda, lo que estaría confirmando que la gran mayoría de campañas vendrían de Estados Unidos. Por otra parte, vemos que, domo el covid es una enfermedad, no es sorpresa que la inmensa mayoría de campañas que concuerdan con las palabras de búsqueda: *Venezuela, Covid* estén en la categoría: `Medical, Illness and Healing`. Sin embargo debe considerarse que, al hacer una revisión manual se encontró que no todas las campañas que estaban en esta sección se hallaban directamente relacionadas a casos de covid-19. Adicionalmente, entre los datos habían campañas que sí estaban relacionadas a casos de covid-19 bajo otros tags, por ejemplo `Accidents & Emergencies` , lo cual representa un limitación en este trabajo. Este tipo de discrepancias y ambiguedades que se encuentran en los datos nos motivan a pensar que la incorporación de técnicas de minería de textos podrían ser útiles para identifcar las campañas de asociadas directamente a casos de covid-19, lo que permitiría la construcción de un indicador más robusto. A su vez, en las distribuciones de las variables numéricas: monto actual, monto total, porcentaje de avance y recuento de donaciones (figuras 6-7); se encontró en todos los casos una asimetría positiva con una moda muy cercana a cero y la presencia de algunas campañas con valores relativamente altos para las variables que se distribuyen. Para el número campañas lanzadas diariamente, la suma de las campañas lanzadas diariamente y el valores promedio de las campañas que se lanzan diariamente, se construyeron series de tiempo. En las figuras 7-9, se presentan las series de tiempo para estas variables, para 3 subconjutos distintos: * Todas los campañas. * Las campañas con las etiquetas: `Medical, Illnes & Healing`. * Las campañas con las etiquetas: `Accidents & Emergencies`. * La unión de los dos subconjutos anteriores: `Medical, Illnes & Healing + Accidents & Emergencies` Como se buscan indicadores que reflejen el estado de la pandemia, los dos candidatos evidentes serían el número de campañas lanzadas diariamente y la suma del valor de las campañas lanzadas diariamente. Sin embargo, esta última variable presenta un problema, ya que las fluctuaciones en el valor promedio de las campañas, el cual parece estar no guardar correlación con el número de casos (comparar las estimaciones del IHME con la figura (9)) influye mucho en el esta variable, lo cual estaría generando un ruido adicional que dificultaría la detección eficaz de picos epidemiológicos. Por último, entre los 4 subconjuntos que se presentan, se observa que los datos de la categoría `Medical, Illnes & Healing` son los que guardarían una mejor correlación con el número de casos de la pandamia en venezuela. Por tal motivo, escogemos solamente a este subconjuto como indicador. """ Incluir gráficas en el documento final: graficos de barras: - Distribución de paises (figura 1) - Distribución de monedas (figura 2) - Distribución de tags (figura 3) histogramas: - Distribución de monto actual y total en dólares (figura 4) - Distribución del porcentaje de avance (figura 5) - Distribución del recuento de donaciones (figura 6) Series de tiempo: - Número de campañas lanzadas diariamente (figura 7). - Suma del valor de las campañas lanzadas diariamente (figura 8). - Valor promedio de las campañas lanzadas diariamente (figura 9). """ ### Twitter Los datos de Twitter se obtienen con el uso de una API dedicada que provee los tweets públicos del archivo completo de Twitter (desde marzo 2006). La API permite hacer búsquedas relacionadas a palabras claves y operadores que hacen coiincidir unos atributos al tweet. La consulta está comprendida entre marzo de 2020 hasta el 10 de mayo de 2021, ésta coincide con con las palabras claves: - covid-19 / coronavirus - infectado covid-19 - muerte covid-19 - (bombona/flujómetro/saturación) de oxígeno - dexametasona - GoFundMe venezuela covid-19 - recolectar dinero - ayuda covid-19 - tratamiento covid-19 - UCI covid-19 - servicio público covid-19 Las consultas se especificaron con y sin hastahtag(\#), ya que con este operador se realiza una coincidencia exacta; las palabras claves se especificaron con y sin tilde diacrítica, debido a que hay distinción entre las palabras que la posean y las que no, no obstante, no se hace distinción entre mayúsculas y minúsculas. Se filtraron todos aquellos tweets que eran retweets y, posteriormente, se eliminaron los repetidos. Adicionalmente, la búsqueda de todas las palabras claves, a excepción de las relacionadas con "GoFundMe", se hizo local, es decir, se restringió la búsqueda al país \cite{mbTw}. Los operadores en la búsqueda son: - -is:retweet. Negación del operador is:retweet, usada para buscar solo tweets originales. - OR. Conjunción (o), implica que los tweets coincidirán si cumple alguna de las condiciones. - place_country:VE. Usada para obtener tweets proveniente del país Venezuela. - has link. Con link adjunto. Las consultas con los operadores place\_country$:$VE y -is$:$retweet son: - ``covid-19 OR coronavirus'' - ``infectado covid-19 OR muerte covid-19'' - ``oxígeno OR dexametasona'' - ``bombona de oxígeno OR dexametasona'' - ``flujómetro de oxígeno OR saturación de oxígeno'' - ``flujometro de oxigeno OR saturacion de oxigeno'' - ``\#flujmetroOxigeno OR \#saturacionOxigeno '' - ``recolectar dinero covid-19 OR ayuda covid-19'' - ``\#RecolectarDinero covid-19 OR #\ayuda covid-19'' - ``#ServicioPúblico covid-19'' - ``#ServicioPublico covid-19'' - ``servicio público covid-19 OR servicio publico covid-19'' - ``ServicioPublico covid-19 OR ServicioPúblico covid-19'' - ``servicio publico OR servicio publico'' - ``UCIS OR unidad de cuidados intensivos'' - ``#UCIS '' - ``tratamiento covid-19'' Las consultas con el operador has link son: - ``GoFundMe venezuela covid-19 OR GoFundMe venezuela covid-19'' - ``\#GoFundMe venezuela covid-19 OR \#GoFundMe venezuela covid-19'' El Notebook que contiene todo el código utilizado para la extracción de datos de Twitter se puede conseguir en \cite{NoTwD}. Las políticas y acuerdos para desarrolladores de las API de Twitter \cite{pTw}, señalan que se permite hacer análisis de su contenido siempre y cuando no se almacenen y presenten datos personales, dedido a esto, de toda la infomación que se recauda, se presenta solo la correspondiente al cuerpo del twitter ``text'' y la fecha de publicación ``created\_ad''. La consulta de las palabras ``covid-19'' y ``coronavirus'', es la que más tweets da por día, tan solo para el primer día del periodo arrojó 430 tweets, sin embargo, se descarta debido a que estos tweets están relacionado a cualquier noticia o comentarios sobre el COVID-19 desde el inicio de la pandemia, no necesariamente sobre infectados. El resto de consultas se divide en 6 grupos, con un total de tweets recaudados de 3307. (ver Tabla \ref{Tabla1}). <<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<< la siguiente información va en tabla con una columna adicional de los tweets recaudados: 365 al grupo 1, 295 al grupo 2, 757 al grupo 3, 1409 al grupo 4, 77 al grupo 5 y 325 al grupo 6. 1. Grupo 1 - infectado covid-19 - muerte covid-19 2. Grupo 2 - bombona de oxígeno - flujometro de oxígeno - saturación de oxígeno - dexametasona 3. Grupo 3 - GoFundMe venezuela covid-19 - recolectar dinero covid-19 - ayuda covid-19 4. Grupo 4 - servicio público 5. Grupo 5 - UCI - unidad de cuidados intensivos. 6. Grupo 6 - tratamiento covid-19 <<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<< Inicialmente, se hizo la consulta sobre la palabra ``oxígeno'', la cual no fue un buen indicador; ésta fue cambiada por ``bombona/flujómetro/saturación de oxígeno''. ``GoFundMe venezuela covid-19'' con el operador 'has link' arroja en su mayoría todos los tweets que son de campañas de apoyo para enfermos de COVID-19. Esta consulta no se hizo en el país Venezuela debido a que es muy difícil abrir una campaña sin tener una cuenta en el exterior \cite{CC}. Las consultas relacionadas a ``servicio público covid-19'' fue la que más tweets arrojó, se esperaba que el número de publicaciones en la franja de abril/mayo de 2021, donde se encuentra el pico más alto de infecciones, según el modelo IHME, fuera más alto, ya que en Venezuela se suele usar la palabra clave ``servicio público'' para ayudas médicas en redes sociales. El Notebook que contiene todo el código utilizado para el análisis y la construcción de las series de tiempo de los datos extraídos de Twitter se puede conseguir en \cite{NoTwA}. ### Google trends Las consultas se hacen por medio de pytrend, una API no oficial de Google Trend que permite una interfaz simple para automatizar los informes de descargas \cite{pytrend}. Entre los métodos que provee se pueden encontrar: interés a lo largo de tiempo, interés histórico por horas, interés por región, tendencias de búsqueda, consultas relacionados, etc. Utiliza parámetros tales como: palabras claves, categorías, país, tiempo y grupos (imágenes, noticias, etc.). Las palabras claves utilizadas son: ``oxígeno'', ``GoFundMe'', ``ayuda económica'', ``servicio público'', ``tratamiento covid-19'' y ``dexametasona''. Éstas se especificaron con y sin tilde diacrítica, arrojando distintos resultados en ambos casos, sin embargo, no hay distinción entre mayúsculas y minúsculas. Todas las búsquedas se hicieron en el país Venezuela y en el intervalo de tiempo de 15 de mayo de 2020 hasta 15 de mayo de 2021. Los tipos de solicitudes que se hacen son 'related\_queries' y 'interest\_over\_time'; las cuales muestran, respectivamente, las búsquedas relacionadas a las palabras claves, donde se les asocian valores en una escala del 0 al 100. El número 100 le corresponde a la tendencia más alta y a medida que va disminuyendo el número, va disminuyendo la tendencia. Finalmente, muestra una serie de tiempo que nos muestra el cambio de popularidad con el tiempo; los valores representan el interés de búsqueda relativo al punto más alto en el gráfico, siendo 100 el pico de popularidad. El Notebook que contiene todo el código utilizado para la extracción de los datos de Google Trends se puede consueguir en \cite{NoGT}. ## Análisis de resultados Las gráficas de serie de tiempo de los tres conjuntos de datos extraídos muestran similitud con el comportamiento del modelo IHME, por lo tanto, como se mencionó anteriormente, el análisis comparativo toma como referencia este modelo, sin tomar en cuenta los datos reportados por el gobierno de Venezuela. La Figura \ref{Figura1} muestra cómo las campañas de GoFundMe aumentaron considerablemente en abril de 2021, coincidiendo con el pico más alto de infecciosos que estima el modelo IHME. Esto evidencia que el número de campañas aumentan a medida que el número de infectados crece, siendo un buen indicador para la incidencia del virus. En la Figura \ref{Figura3} se observa un comportamiento irregular a lo largo de la pandemia, sin embargo, se puede notar que en septiembre de 2020 existe un número de publicaciones considerablemante más alto que en otras fechas. También tenemos un incremento notable en agosto de 2020 y abril de 2021. En comparación con la serie de tiempo base, los picos están en las mismas fechas, pero en distinta proporción. Las búsquedas más significativas y los valores que se acercan más a los datos aportados por el IHME fueron las palabras: ``oxigeno''(sin tilde), ``GoFundMe'', ``tratamiento covid'' y``dexametasona''. En la Tabla \ref{Tabla2} y Figura \ref{Figura3} se muestran las búsquedas relacionadas y las series de tiempo de cada palabra, respectivamente. El interés del público en palabras claves asociadas al COVID-19, es un buen indicador para estimar la magnitud del virus en Venezuela. ## Discusión de los resultados Our World in Data provee, entre otras cosas, un modelo que estima el número real de infectados de COVID-19 en Venezuela (IHME) y el número de infectados reportados por el gobierno. Al analizar las gráficas de series de tiempo de estos datos y la de los datos extraídos de las distintas plataformas, se observa que hay dos puntos críticos en septiembre de 2020 y mayo de 2021. Sin embargo, el número de infectados reportados por el gobierno de Venezuela no muestra el incremento abrupto en estos picos, reforzando la teoría de que las cifras dadas por el gobierno de Venezuela no son reales. En Venezuela, tanto el número de campañas de GoFundMe y el interés público sobre las palabras claves de covid-19, tienen un pico muy pronunciado en abril de 2021, éstos se relacionan con el número de casos reales de COVID-19 estimados en Venezuela por el modelo del IHME. Por otro lado, las publicaciones de Twitter relacionadas al COVID-19 aumentan a medida que incrementa el número de infectados reales estimados. A modo de conclusión, internet es un medio para buscar y difundir información, ofreciendo información que se puede utilizar para identificar enfermedades y estimar tasas de incidencias a lo largo del tiempo. Si se hace un estudio más exhaustivo, podrían ser una fuente de información clave para predecir o detectar incidencias de brotes en la humanidad. - Discutir cuales eran los mejores indicadores - Discutir el impacto que puede tener tener otros indicadores cuando la información es escasa, y como esto podría expanderse a otros paises. - Cosas que podrían hacerese en el futuro con estos datos ## Referencias [1] http://www.healthdata.org/special-analysis/covid-19-estimating-historical-infections-time-series [2] https://www.dw.com/es/la-pandemia-en-venezuela-manipulaci%C3%B3n-de-la-informaci%C3%B3n-cementerios-llenos-y-a%C3%BAn-sin-plan-de-vacunaci%C3%B3n/a-57258234 [3] Twitter. Es lo que está pasando.https://twitter.com [4] ttps://es.wikipedia.org/wiki/Interfaz_de_programaci%C3%B3n_de_aplicaciones [5] https://trends.google.es [6] https://support.google.com/trends/answer/4365533?hl=es [7] Friedman J, Liu P, Troeger CE, Carter A, Reiner RC, Barber RM, Collins J, Lim SS, Pigott DM, Vos T, Hay SI, Murray CJL, Gakidou E. Predictive performance of international COVID-19 mortality forecasting models. Nature Communications. 10 May 2021. doi: 10.1038/s41467-021-22457-w. [8] https://ourworldindata.org/grapher/daily-new-estimated-covid-19-infections-ihme-model?country=~VEN [9] https://github.com/HarveyMaddocks/gofundme_webscraper [10] notebook de GoFundMe [11] https://www.caracaschronicles.com/2021/04/15/gofundme-venezuelans-lifesaver-against-covid-19/ [12] https://www.ncbi.nlm.nih.gov/pmc/articles/PMC3273528/ [13] https://www.businessinsider.com/gofundme-being-used-for-medical-costs-is-bad-sign-for-us-healthcare-2019-1 [14] https://www.forbes.com/sites/carolynmcclanahan/2018/08/13/using-gofundme-to-attack-health-care-costs/?sh=26aeb3812859 [15] https://www.huffpost.com/entry/gofundme-health-care-system_n_5ced9785e4b0ae6710584b27 [16] https://developer.twitter.com/en/docs/twitter-api/tweets/search/integrate/build-a-query#examples [17] notebook de Twitter [18] https://developer.twitter.com/en/developer-terms [19] notebook de Twitter [20] https://pypi.org/project/pytrends/ [21] notebook google trends

    Import from clipboard

    Paste your markdown or webpage here...

    Advanced permission required

    Your current role can only read. Ask the system administrator to acquire write and comment permission.

    This team is disabled

    Sorry, this team is disabled. You can't edit this note.

    This note is locked

    Sorry, only owner can edit this note.

    Reach the limit

    Sorry, you've reached the max length this note can be.
    Please reduce the content or divide it to more notes, thank you!

    Import from Gist

    Import from Snippet

    or

    Export to Snippet

    Are you sure?

    Do you really want to delete this note?
    All users will lose their connection.

    Create a note from template

    Create a note from template

    Oops...
    This template has been removed or transferred.
    Upgrade
    All
    • All
    • Team
    No template.

    Create a template

    Upgrade

    Delete template

    Do you really want to delete this template?
    Turn this template into a regular note and keep its content, versions, and comments.

    This page need refresh

    You have an incompatible client version.
    Refresh to update.
    New version available!
    See releases notes here
    Refresh to enjoy new features.
    Your user state has changed.
    Refresh to load new user state.

    Sign in

    Forgot password

    or

    By clicking below, you agree to our terms of service.

    Sign in via Facebook Sign in via Twitter Sign in via GitHub Sign in via Dropbox Sign in with Wallet
    Wallet ( )
    Connect another wallet

    New to HackMD? Sign up

    Help

    • English
    • 中文
    • Français
    • Deutsch
    • 日本語
    • Español
    • Català
    • Ελληνικά
    • Português
    • italiano
    • Türkçe
    • Русский
    • Nederlands
    • hrvatski jezik
    • język polski
    • Українська
    • हिन्दी
    • svenska
    • Esperanto
    • dansk

    Documents

    Help & Tutorial

    How to use Book mode

    Slide Example

    API Docs

    Edit in VSCode

    Install browser extension

    Contacts

    Feedback

    Discord

    Send us email

    Resources

    Releases

    Pricing

    Blog

    Policy

    Terms

    Privacy

    Cheatsheet

    Syntax Example Reference
    # Header Header 基本排版
    - Unordered List
    • Unordered List
    1. Ordered List
    1. Ordered List
    - [ ] Todo List
    • Todo List
    > Blockquote
    Blockquote
    **Bold font** Bold font
    *Italics font* Italics font
    ~~Strikethrough~~ Strikethrough
    19^th^ 19th
    H~2~O H2O
    ++Inserted text++ Inserted text
    ==Marked text== Marked text
    [link text](https:// "title") Link
    ![image alt](https:// "title") Image
    `Code` Code 在筆記中貼入程式碼
    ```javascript
    var i = 0;
    ```
    var i = 0;
    :smile: :smile: Emoji list
    {%youtube youtube_id %} Externals
    $L^aT_eX$ LaTeX
    :::info
    This is a alert area.
    :::

    This is a alert area.

    Versions and GitHub Sync
    Get Full History Access

    • Edit version name
    • Delete

    revision author avatar     named on  

    More Less

    Note content is identical to the latest version.
    Compare
      Choose a version
      No search result
      Version not found
    Sign in to link this note to GitHub
    Learn more
    This note is not linked with GitHub
     

    Feedback

    Submission failed, please try again

    Thanks for your support.

    On a scale of 0-10, how likely is it that you would recommend HackMD to your friends, family or business associates?

    Please give us some advice and help us improve HackMD.

     

    Thanks for your feedback

    Remove version name

    Do you want to remove this version name and description?

    Transfer ownership

    Transfer to
      Warning: is a public team. If you transfer note to this team, everyone on the web can find and read this note.

        Link with GitHub

        Please authorize HackMD on GitHub
        • Please sign in to GitHub and install the HackMD app on your GitHub repo.
        • HackMD links with GitHub through a GitHub App. You can choose which repo to install our App.
        Learn more  Sign in to GitHub

        Push the note to GitHub Push to GitHub Pull a file from GitHub

          Authorize again
         

        Choose which file to push to

        Select repo
        Refresh Authorize more repos
        Select branch
        Select file
        Select branch
        Choose version(s) to push
        • Save a new version and push
        • Choose from existing versions
        Include title and tags
        Available push count

        Pull from GitHub

         
        File from GitHub
        File from HackMD

        GitHub Link Settings

        File linked

        Linked by
        File path
        Last synced branch
        Available push count

        Danger Zone

        Unlink
        You will no longer receive notification when GitHub file changes after unlink.

        Syncing

        Push failed

        Push successfully