# Savoir et savoir-faire AIDE
> RL=régression linéaire
### OA1
> Choisir la méthode d'analyse inférentielle la plus adaptée à une problématique posée et aux données disponibles associées, parmi les méthodes d’analyse classiques : régression linéaire, ANOVA.
* reconnaître une variable qualitative=une variable catégorielle=un facteur, une modalité; une variable quantitative=une variable numérique
* savoir quels sont les types des variables prédites/prédicteurs pour ANOVA et RL
* savoir choisir la méthode lorsque la question le permet parmi :
* ANOVA à 1 ou plusieurs facteurs
* RL simple ou multiple
### OA2
> Connaître les étapes théoriques des calculs des différentes méthodes abordées, et savoir interpréter les valeurs caractéristiques de ces méthodes.
* préciser le modèle statistique utilisé
* ANOVA : y_ij=mu_i+epsilon_ij=mu+alpha_i+epsilon_ij
* RL : y_i=beta0+beta1x_i+epsilon_i
* dans les 2 cas les erreurs ~N(0,sigma2),
* pour ANOVA et RL, savoir ce que représentent les différents termes qui apparaissent dans les formules précédentes, savoir les réprésenter sur un graphique
* pour ANOVA et RL, savoir ce qui est prédiction et erreur, savoir les réprésenter sur un graphique
* savoir représenter la ddp de la distribution des erreurs sur le graphique
* pour ANOVA et RL, donner les H0/H1
* pour ANOVA et RL, savoir que la SC se somme, SCT=SCE+SCR. Savoir calculer ces différentes sommes et expliquer ce qu'elles représentent à l'aide d'un graphique
* statistique et test
* pour ANOVA et régression, savoir remplir une table ANOVA : ddl, CME, CMR, statistique F=CME/CMR, savoir qu'elle suit une loi de Fisher sous H0 en précisant les ddl, savoir comment elle est utilisée pour produire la p-value
* postulats
* pour ANOVA et la RL, erreurs supposées indépendantes, normales, de moyennes nulles et de variance homogène
* savoir identifier un outlier
* pour RL, savoir identifier un point influent
* R2
* savoir que R2=coefficient de détermination=% de variabilité expliquée par le modèle
* savoir le calculer pour une ANOVA et une RL simple : R2=SCE/SCT=1-SCR/SCT
* savoir que R2=r2 pour une RL simple
### OA3
> Produire les résultats numériques et graphiques de ces analyses avec le logiciel R.
* savoir réaliser une ANOVA et une RL sous R (aov, lm, anova)
* savoir effectuer les différentes représentations des résidus d'une ANOVA ou RL (residuals, plot)
* savoir tester a posteriori la normalité et l'homogénéité de la variance des résidus
* en produisant les graphiques adéquats
* à l'aide de tests (shapiro.test, bartlett.test/levene.test, ncvTest)
* savoir tracer un IC95 sur une droite de régression, sur la moyenne ou sur les obs (predict)
* savoir faire un test post-hoc après une ANOVA (tukeyHSD)
### OA4
> Interpréter les sorties obtenues avec le logiciel R pour répondre à la problématique posée.
* savoir lire une sortie R
* de la fonction anova, notamment aller chercher la p-value et l'interpréter
* de la fonction summary, notamment aller chercher les valeurs des paramètres estimés, le R2, les p-values
* savoir interpréter la représentation graphique de diagnostic des résidus et des tests, afin de valider si pas de problème ou identifier la nature d'un problème
* non normalité
* variance non homogène
* dépendance
* modèle de prédiction non adéquat
* outlier
* point influent
* savoir interpréter un test post-hoc après une ANOVA, savoir l'utiliser pour classer les modalités par ordre croissant de la variable prédite