--- title: c01. Introdução ao Machine Learning --- Introdução ao Machine Learning === ## Introdução **Repositório**: [link](https://curso-r.github.io/202108-intro-ml/) **Google class**: [link](https://classroom.google.com/u/0/w/MzAzNzMwMDgxNTY5/t/all) **Meu trabalho final**: Link com as informações gerais do desafio. [ERROR]() ## Aula 01 - Introdução {%youtube W8GrUalCH_c %} Fonte: https://www.youtube.com/watch?v=W8GrUalCH_c Recomendações de livros - [Feature Engineering](http://www.feat.engineering/) - [Forecast and Principles](https://otexts.com/fpp3/) - [Aprendizado de máquina](http://www.rizbicki.ufscar.br/AME.pdf) - [Tidymodels](https://www.tidymodels.org/) - [R for data science](https://r4ds.had.co.nz/) - [The Elements of Statistical Learning](https://web.stanford.edu/~hastie/ElemStatLearn/printings/ESLII_print12_toc.pdf) - Fonte[^first] - [A Introduction to Statistical Learning](https://www.statlearning.com/) - Fonte[^second] [^first]: Footnote: https://web.stanford.edu/~hastie/ElemStatLearn/ [^second]: Footnote: https://www.statlearning.com/ ## Aula 02 - Step de modelagem {%youtube EphedhJ7EnM %} Fonte: https://www.youtube.com/watch?v=EphedhJ7EnM - Interessante para um tempo para aprender dentro do [tidymodel](https://www.tidymodels.org/learn/). - Estudar sobre a função "recipe" - addin tidymodels -> instalar no RStudio ## Aula 03 - Step de modelação e dataprep e classificação {%youtube Ij7JD3HWRvk %} Fonte: https://www.youtube.com/watch?v=Ij7JD3HWRvk - [Pacote fixest](https://lrberge.github.io/fixest/) e sua conta no [CRAN](https://cran.r-project.org/web/packages/fixest/index.html) - Estudar o [recipe](https://recipes.tidymodels.org/) - Estudar GLM - [datacamp](https://www.datacamp.com/courses/generalized-linear-models-in-r) - [Aula dados no divã](https://www.youtube.com/watch?v=83hWivv9wdc) - [Laboratório de Ecologia de Florestas Tropicais](http://labtrop.ib.usp.br/doku.php?id=cursos:planeco:roteiro:10-glm) - [Livro GLM da UFPR](https://docs.ufpr.br/~taconeli/CE225/tp.pdf) - Ver função **model.matrix** para gerar variáveis dummys - Não entendi muito bem com funciona interação no R (procurar material) **Outras referências** * [Transformações recomendadas p/ cada modelo](https://www.tmwr.org/pre-proc-table.html) * [Lista de transformações do recipes]( https://recipes.tidymodels.org/reference/index.html) * [Embbed: p/ quando o preditor tem muitas categorias]( https://embed.tidymodels.org/) * [Textos: quando colunas tem textos ](https://github.com/tidymodels/textrecipes) * [Séries temporais](https://business-science.github.io/timetk/reference/index.html#section-feature-engineering-operations-recipe-steps-) ## Aula 04 {%youtube fG8mCexz3L8 %} Fonte: https://www.youtube.com/watch?v=fG8mCexz3L8 - [Matriz de confusão](https://www.wikiwand.com/en/Confusion_matrix) - [Curva ROC](http://arogozhnikov.github.io/2015/10/05/roc-curve.html) - [Entendo matriz de confusão](https://medium.com/data-hackers/entendendo-o-que-%C3%A9-matriz-de-confus%C3%A3o-com-python-114e683ec509) - [Glossário dos dados do exercício prático](https://github.com/gastonstat/CreditScoring) ::: success :rocket: [ML no Google](https://developers.google.com/machine-learning/crash-course) ::: --- ## Aula 05 {%youtube y_hctuRjkt0 %} Fonte: https://www.youtube.com/watch?v=y_hctuRjkt0 --- ## Aula 06 {%youtube lF0-JYn1YHU %} Fonte: https://www.youtube.com/watch?v=lF0-JYn1YHU - [Tutorial](https://www.datacamp.com/community/tutorials/decision-trees-R) sobre árvore de decisão - [Dr. Why](https://dalex.drwhy.ai/) - excelente referência - [Discussão sobre generalização das bases treino e teste](https://arxiv.org/abs/1611.03530) --- ## Aula 07 {%youtube EHt27vuXcNU %} Fonte: https://www.youtube.com/watch?v=EHt27vuXcNU [Stacks - Tidy Model Stacking](https://stacks.tidymodels.org/) Stacks is an R package for model stacking that aligns with the tidymodels. Model stacking is an ensembling method that takes the outputs of many models and combines them to generate a new model—referred to as an ensemble in this package—that generates predictions informed by each of its members. [Workflow Sets - Tidymodels](https://workflowsets.tidymodels.org/) É um processo novo e interessante de ser estudado. [Competição Kaggle](https://www.kaggle.com/c/ga-customer-revenue-prediction) --- ## Aula 08 {%youtube TCAqcbSKQHM %} Fonte: https://www.youtube.com/watch?v=TCAqcbSKQHM ###### tags: `curso-R` `capítulos` --- Referência