# Introducción a machine learning con Tidymodels
Presentadoras: Roxana Noelia Villafañe, Ana Laura Diedrichs y Patricia Loto.
Fecha y Lugar
-------------
🗓️ Jueves 24 de septiembre del 2020
⏰ Horario a definir
🏨 Online
🌎 [Primer Congreso de Bionformática](https://womenbioinfodatascla.github.io/index.html)
Descripción
------------------------------------------------------------
La modelización de datos en estos últimos años ha despertado una gran atención debido al acceso a datos no antes visto. Esto trae aparejado el interés creciente de aprender herramientas útiles que permitan realizar análisis de manera simple, eficaz y reproducible. Tidymodels es un conjunto de paquetes dedicado a aprendizaje automático, que proporciona una gramática para modelado de datos y se incorpora sin problemas con los demás paquetes de tidyverse. Este workshop es una introducción al aprendizaje automático y a los paquetes de tidymodels.
Nos centraremos en aprender a entrenar y evaluar modelos modelos de machine learning.
# ¿Este curso es para mí?
1. Tienes conocimientos básicos del lenguaje R y la IDE de Rstudio.
2. Quieres aprender especificamente sobre modelado de datos utilizando el conjunto de paquetes comprendidos en Tidymodels.
3. Tienes conocimientos básicos de ggplot2.
4. Tienes un manejo básico de tidyverse.
5. Quieres conocer cuáles son los modelos más comúnmente utilizados y cómo implementarlos con tidymodels.
Si crees que debes reforzar algún punto de los enunciados anteriormente, podes practicar con los [primers de Rstudio]().
# Objetivos de aprendizaje
Los estudiantes aprenderan a entrenar, supervisar y generar predicciones con modelos de Machine Learning con los paquetes de Tidymodels.
💻 Antes del workshop
------------------------------------------------------------
Gracias por inscribirte a este workshop, en el mismo trabajaremos con la versión más reciente de R y Rstudio, por lo que, para aprovecharlo deberás traer una pc portátil con lo siguiente instalado:
Instalación de R and RStudio
- Una versión reciente de **R (>=3.6.4)** disponible de manera gratuita para su descarga en [CRAN](https://cran.r-project.org/).
- Una versión reciente de **Rstudio Desktop (>= 1.3.959)** disponible de manera gratuita para su descarga en [Rstudio](https://www.rstudio.com/download).
En ambos casos, ten en cuenta cuál es el Sistema Operativo que utilizas y la versión del mismo (32 o 64 bits) para descargar la versión correcta tanto de R como de Rstudio.
- Los paquetes que utilizaremos pueden instalarse, abriendo Rstudio y ejecutando las siguientes sentencias:
```r
mis_paquetes <- c("tidyverse", "tidymodels","devtools", "kknn", "rpart", "rpart.plot", "rattle", "AmesHousing", "ranger", "partykit", "vip")
install.packages(mis_paquetes, repos = "http://cran.rstudio.com")
```
Para poder instalar de manera exitosa los paquetes, es necesario que estés conectado a Internet.
¿Cómo verifico que los paquetes se instalaron correctamente?
Para verificar que los paquetes se cargaron correctamente, por favor ejecutá las sentencias que están a continuación:
```r
easypackages::libraries("tidyverse", "gapminder","babynames","survey","socviz","here","cowplot",
"patchwork", "ggrepel","ggridges","ggforce", "gridExtra","extrafont",
"scales","wesanderson","viridis", "viridisLite","prismatic","fishualize",
"RColorBrewer", "ggtext","ggthemes","hrbrthemes","plotly","highcharter","GGally",
"sf","maps", "mapdata","mapproj","rnaturalearth","devtools")
```
✍️ Slides y Código
------------------------------------------------------------
Tanto la [presentación](https://github.com/PatriLoto/viz-datos-con-ggplot2-para-WIDS2020/blob/master/material/PRESENTACION_WIDS2020.pdf) como los [archivos rmarkdown](https://github.com/PatriLoto/viz-datos-con-ggplot2-para-WIDS2020/blob/master/material) se encuentran en la carpeta **Material**.
📓 **Bibliografía**
-------------------------------------------------------------------------------------------------------------------
Para la elaboración tanto del material teórico como de los ejercicios prácticos se utilizaron como referencia, los libros descriptos a continuación:
- [Página oficial del proyecto Tidymodels](https://github.com/tidymodels) de Rstudio
- [Tutoriales de Tidymodels](https://www.tidymodels.org/learn/)
- [Introduction to ML con Tidymodels](https://conf20-intro-ml.netlify.app/) de [Allison Hill](https://github.com/rstudio-conf-2020/intro-to-ml-tidy/commits?author=apreshill) en la rstudio::conf 2020
- [Tutoriales de Max Kuhn en la rstudio::conf 2017-2020- Repositorio](https://github.com/topepo/rstudio-conf)
- [Canal de Youtubel de Julia Silge](https://www.youtube.com/channel/UCTTBgWyJl2HrrhQOOc710kA) y el [código](https://juliasilge.com/)
- [R para Ciencia de Datos](https://es.r4ds.hadley.nz/) de Hadley Wickham - [Capítulo 23: Modelos](https://es.r4ds.hadley.nz/visualizaci%C3%B3n-de-datos.html) y [Capítulo 24: Modelos](https://es.r4ds.hadley.nz/comunicar-con-gr%C3%A1ficos.html).
**Material Extra**
============================================================
- [Max Kuhn. Feature Engineering](http://www.feat.engineering/)
- [Max Kuhn. Applied Predictive Modeling](https://link.springer.com/book/10.1007/978-1-4614-6849-3)