---
title: c01. Introdução ao Machine Learning
---
Introdução ao Machine Learning
===
## Introdução
**Repositório**: [link](https://curso-r.github.io/202108-intro-ml/)
**Google class**: [link](https://classroom.google.com/u/0/w/MzAzNzMwMDgxNTY5/t/all)
**Meu trabalho final**: Link com as informações gerais do desafio. [ERROR]()
## Aula 01 - Introdução
{%youtube W8GrUalCH_c %}
Fonte: https://www.youtube.com/watch?v=W8GrUalCH_c
Recomendações de livros
- [Feature Engineering](http://www.feat.engineering/)
- [Forecast and Principles](https://otexts.com/fpp3/)
- [Aprendizado de máquina](http://www.rizbicki.ufscar.br/AME.pdf)
- [Tidymodels](https://www.tidymodels.org/)
- [R for data science](https://r4ds.had.co.nz/)
- [The Elements of Statistical Learning](https://web.stanford.edu/~hastie/ElemStatLearn/printings/ESLII_print12_toc.pdf)
- Fonte[^first]
- [A Introduction to Statistical Learning](https://www.statlearning.com/)
- Fonte[^second]
[^first]: Footnote: https://web.stanford.edu/~hastie/ElemStatLearn/
[^second]: Footnote:
https://www.statlearning.com/
## Aula 02 - Step de modelagem
{%youtube EphedhJ7EnM %}
Fonte: https://www.youtube.com/watch?v=EphedhJ7EnM
- Interessante para um tempo para aprender dentro do [tidymodel](https://www.tidymodels.org/learn/).
- Estudar sobre a função "recipe"
- addin tidymodels -> instalar no RStudio
## Aula 03 - Step de modelação e dataprep e classificação
{%youtube Ij7JD3HWRvk %}
Fonte: https://www.youtube.com/watch?v=Ij7JD3HWRvk
- [Pacote fixest](https://lrberge.github.io/fixest/) e sua conta no [CRAN](https://cran.r-project.org/web/packages/fixest/index.html)
- Estudar o [recipe](https://recipes.tidymodels.org/)
- Estudar GLM
- [datacamp](https://www.datacamp.com/courses/generalized-linear-models-in-r)
- [Aula dados no divã](https://www.youtube.com/watch?v=83hWivv9wdc)
- [Laboratório de Ecologia de Florestas Tropicais](http://labtrop.ib.usp.br/doku.php?id=cursos:planeco:roteiro:10-glm)
- [Livro GLM da UFPR](https://docs.ufpr.br/~taconeli/CE225/tp.pdf)
- Ver função **model.matrix** para gerar variáveis dummys
- Não entendi muito bem com funciona interação no R (procurar material)
**Outras referências**
* [Transformações recomendadas p/ cada modelo](https://www.tmwr.org/pre-proc-table.html)
* [Lista de transformações do recipes]( https://recipes.tidymodels.org/reference/index.html)
* [Embbed: p/ quando o preditor tem muitas categorias]( https://embed.tidymodels.org/)
* [Textos: quando colunas tem textos ](https://github.com/tidymodels/textrecipes)
* [Séries temporais](https://business-science.github.io/timetk/reference/index.html#section-feature-engineering-operations-recipe-steps-)
## Aula 04
{%youtube fG8mCexz3L8 %}
Fonte: https://www.youtube.com/watch?v=fG8mCexz3L8
- [Matriz de confusão](https://www.wikiwand.com/en/Confusion_matrix)
- [Curva ROC](http://arogozhnikov.github.io/2015/10/05/roc-curve.html)
- [Entendo matriz de confusão](https://medium.com/data-hackers/entendendo-o-que-%C3%A9-matriz-de-confus%C3%A3o-com-python-114e683ec509)
- [Glossário dos dados do exercício prático](https://github.com/gastonstat/CreditScoring)
::: success
:rocket: [ML no Google](https://developers.google.com/machine-learning/crash-course)
:::
---
## Aula 05
{%youtube y_hctuRjkt0 %}
Fonte: https://www.youtube.com/watch?v=y_hctuRjkt0
---
## Aula 06
{%youtube lF0-JYn1YHU %}
Fonte: https://www.youtube.com/watch?v=lF0-JYn1YHU
- [Tutorial](https://www.datacamp.com/community/tutorials/decision-trees-R) sobre árvore de decisão
- [Dr. Why](https://dalex.drwhy.ai/) - excelente referência
- [Discussão sobre generalização das bases treino e teste](https://arxiv.org/abs/1611.03530)
---
## Aula 07
{%youtube EHt27vuXcNU %}
Fonte: https://www.youtube.com/watch?v=EHt27vuXcNU
[Stacks - Tidy Model Stacking](https://stacks.tidymodels.org/)
Stacks is an R package for model stacking that aligns with the tidymodels. Model stacking is an ensembling method that takes the outputs of many models and combines them to generate a new model—referred to as an ensemble in this package—that generates predictions informed by each of its members.
[Workflow Sets - Tidymodels](https://workflowsets.tidymodels.org/)
É um processo novo e interessante de ser estudado.
[Competição Kaggle](https://www.kaggle.com/c/ga-customer-revenue-prediction)
---
## Aula 08
{%youtube TCAqcbSKQHM %}
Fonte: https://www.youtube.com/watch?v=TCAqcbSKQHM
###### tags: `curso-R` `capítulos`
---
Referência