# Réunion DATA-CEVI R 18 janvier 2022 Présents : EM, JP, CL ### Point sur la maquette actuelle Expression concernant la maquette actuelle selon les 4 rubriques suivantes : * **A enlever** * ggplot : syntaxe spécifique (pas du R), difficile à comprendre la logique (aes) pour les étu, difficile pour les enseignants d'aider les étu * production=graphique uniquement. Et R ? Et l'analyse de données ? * BDD AGRESTE : tables résumées pour la plupart, pas de données brutes (donc pas de chargement, graphiques limités, pas de calcul de stat descr), des données manquantes dans les tables, difficile pour les étudiants de trouver des données intéressantes décrivant le contexte de leur exploitation * **A garder tel quel** * Projet personnel pour les étudiants, données spécifiques => motivation => engagement dans le travail * Les données des différents projets sont légèrement différentes les unes des autres => limite la triche, facilite l'entraide intelligente entre étu, variété dans les échanges avec les étu en TD * ggplot : graphiques esthétiques * alternance TA/TD * production concrète, finalisée (=figure) : donne un sens à l'activité * TD à 2 enseignants : plus dynamique, plus sympa, meilleure qualité * **A garder mais à améliorer** * cours en ligne sur Openclassroom : intéressant mais trop long * quizz sur Moodle * adapter les questions au contenu du cours en ligne, ce qui doit être acquis * 100 étu ont eu >=15, qui ont donc fait le job. Mais 50 ont eu <14, avec certains une très mauvaise notes, ces étudiants n'ont pas acquis les prérequis sur R * Page Moodle : a alléger, ne garder que l'essentiel * Grille critériée et évaluation par les pairs : explicite les attentes, pas 160 copies à corriger, permet aux étudiants de voir en détail d'autres productions. A adapter si on change la production (plus figure) * **A rajouter** * Chargement des données sous R : les étu ne savent pas importer correctement des données en fin de parcours * Analyse de données ! * R ! * Cours sur les bonnes pratiques sur R * Importer et analyser les données de l'UE Vin ### Proposition de nouvelle maquette #### Résumé * ne plus faire travailler les étu sur les données AGRESTE ni avec ggplot2, afin de se recentrer sur R et l'analyse de données * garder un projet perso, car cela engage les étu dans le travail, utilisant des données sur le stage en exploitation, noter la production finale. De même, ce centrer dans l'eval sur R et l'analyse de données : * les étu collectent leurs données à la Toussaint et travaillent dessus d'ici Noël * vérifier auprès de MW que la collecte de données est pour la plupart des étu faisable (quitte à renvoyer ceux pour qui ça ne l'est pas en plan B sur les BDD) * préparer les étu à cette production notée et à l'UE Vin en proposant 2 TD plus classiques * TD sur l'importation de données : proposer différents exercices avec chacun * un format de fichier différent * une manipulation de sous-tableau * une stat descr à calculer sur R * TD sur la production de graphiques de base (mono/bi variés) sur les données de l'UE Vin * tous les etu chargent le même tableau (et y arrivent bien sûr) * les étu produisent les graphiques de base possible, sur des données quali/quanti en mono/bi variés * le tableau s'y prêtant, varier si possible les questions (différentes données, graphique de même type), pour favoriser l'entre-aide #### Séquencement des activités > Avant la Toussaint > * R séance 1 : SP : Cours d'introduction * intérêt de l'analyse de données, à R * structure d'un tableau de données * structure du parcours * R séance 2+3 : TA : Cours en ligne d'initiation à R + quizz blanc sur Moodle * R séance 4 : TD : bonnes pratiques avec R * Quizz noté (court) sur le cours en ligne, petit coef, retour sur le quizz * Bonnes pratiques (ouvrir un script, commenter un script, changer de répertoire courant, ...) * R séance 5 : SP : statistiques descriptives * R séance 6 : TD : importation de données et statistiques descriptives * chargement de données, extraction de données, calcul de statistiques descriptives * R séance 7 : TD : graphiques avec R * graphiques sur des données quali/quanti en mono/bi variés (données UE Vin) > Après la Toussaint (les étu ont leur données) * R séance 8+9 : TA : les etu importent leurs données personnelles, calculent une statistique descriptive, réalisent un graphique de base (pas avec ggplot), compilent cela dans un doc de 1 page A4 > +1 CM : cours d'ouverture sur la visualisation * Evaluation * les étu déposent leur production sur Moodle, 1 page A4 + un script R + un fichier de données * evaluation par les pairs ### A faire * CL * préciser le contenu du cours en ligne qui doit être vu * adapter le quizz moodle en fonction * revoir la grille criteriée * description des données * source * type * quantité * stat descr * graphique * forme * fond * R * le script R fourni doit marcher tel quel * FAIT : voir avec Magali Willaume ce qui est possible en terme de collecte de données pendant le premier stage en exploitation * mettre à jour la page Moodle * mettre à jour le CM1 * MFJ * préparer le TD1 (bonnes pratiques R) * JP * préparer le TD2 (chargement des données) * EM * préparer le TD3 (graphiques sur les données Vin) ### Remarques * cette proposition permet d'apporter une réponse à la majorité des points cités dans les 4 rubriques : A enlever, A garder tel quel, A garder mais à améliorer, A rajouter :) * Cependant les etu ne seront plus suivis pendant la réalisation de leur production : * on ne les aide pas sur R dans la réalisation de leur production notée (mais on les préparera grâce aux TD1-3) * nous n'aurons plus de discussion en tête à tête * plus besoin d'être 2 enseignants par séance ? ### Données #### Caractéristiques des données à collecter > Préciser la taille du tableau, le type de données (quali/quanti) #### Concernant les données à collecter sur l'exploitation Suite à la discussion avec Magali Willaume (25 janv 2022) > Préciser aux étudiants : > > * les données relatives à l'exploitation peuvent être sensibles (ex comptables), surtout pour un premier stage. A adapter au cas par cas, suivant le type d'exploitation, la relation de confiance qui est établie avec l'exploitant. Il est possible de collecter des données décrivant le contexte (sur AGRESTE, ...) si la collecte de données sur l'exploitation semble délicate > * allouer peu de temps à cette collecte de données, ce n'est pas le but premier du stage qui a lieu à la Toussaint, qui est un stage ouvrier > * un petit tableau bien choisi suffit pour travailler (ex 20 lignes 2 colonnes) > * des données pluriannuelles sont potentiellement plus intéressantes, afin de prendre en considération des variations inter-annuelles Quelques propositions de données qui pourraient être collectées sur l'exploitation : * Ventes (volume, ...) * Temps de travail (nombre de passages d'engins, recrutement saisonnier, ...) * Production : * qualité (teneurs en protéines, matière organique, ...) * quantité (production, ...) * Assolement * Données comptables : ces données existent généralement, car archivées par l'exploitant, mais sont sensibles, donc attention.