# Processing with AI ## Partie 2: 👩‍⚖️ Ethics of AI Nom - Prénom : > Hugon > Grégoire Sujet : > 🎥 Monitor student attention in class using Computer Vision >[TOC] ## Cahier des charges ### Biais Si notre jeu de données n'est pas conçu avec suffisamment de rigueur, les biais suivant risquent d'apparaître : >1. Le premier biais en matière d'attention des élèves est dû à l'âge de ceux-ci. En effet, la différence de comportements en cours entre de jeunes élèves (classes primaires et collège), plus sujets aux mouvements parasites, et des élèves plus agés (étudiants à l'université) peut être très différente. Dès lors, l'ordinateur pourrait par exemple conlure à un cours ininterressant chez de jeunes sujets, plus turbulents, que chez des plus agés plus calmes. Et ce, alors même que le cours a potentiellement plus interressé les plus jeunes, leurs mouvements pouvant manifester leur intérêt pour le cours alors que les plus âgés peuvent rester amorphes devant un cours qui ne les interressent pas. >2. Le second biais, peut émerger dans les différentes attitudes des élèves lorsqu'ils sont attentifs. En effet, certains élèves lorsqu'ils sont interressés notent énormément d'éléments alors que d'autres préfèrent écouter. Si l'ordinateur est insuffisament entrainé par ces deux types d'élèves, il pourrait croire que l'élève qui prend beaucoup de notes, et donc regarde là où il tape et non le professeur à l'écran est moins interressé par le cours que l'élève qui reste immobile. >3. Enfin, si l'ordinateur n'est pas entrainé à dissocier les réactions à ce qui est dit en cours par rapport à un évènement extérieur, il peut arriver à de mauvaises conclusions sur l'attention de l'étudiant. Un étudiant peut aussi bien sourire à une blague du professeur qu'à un évènement extérieur au cours. Nous allons donc nous assurer que notre modèle n'est pas biaisé en : >1. Sourçant nos données depuis différentes tranches d'ages. Il conviendra d'entrainer l'ordinateur sur des réactions d'élèves plus ou moins jeunes et de mettre en adéquation leurs réactions à leur résultat scolaire mais sans les mélanger. On pourra ainsi isoler 3 tranches d'ages : Enfants (8/12 ans), adolescents (13/17 ans) et adultes (Plus de 18 ans) afin d'observer indépendemment leurs réactions et leurs résultats. >2. S'assurant que nos données prennent en compte les élèves studieux qui tapent les notes sur leur clavier et ceux qui regardent attentivement l'écran. Afin de voir les plus attentifs, à la fin des sessions qui servent à entrainer l'ordinateur, il faudra soumettre directement un petit quizz aux élèves afin de savoir s'ils ont bien écouté le cours. >3. Enfin pour identifier les sourires déclenchés par le professeur, l'ordinateur pourra analyser si la plupart des élèves en cours en ligne ont eu un sourire en même temps. Si tel est le cas, on peut penser qu'ils sont attentifs alors qu'un élève qui sourit à contre temps est probablement en train de réagir à un élément extérieur au cours. ### Overfitting Nous allons nous assurer que notre modèle ne sera pas dans une situation de sur-apprentissage (overfit) en : > Vérifiant la précision de notre modèle en l'entrainant sur les 3 différentes tranches d'ages avant de le tester sur une conférence qui s'adresse des plus jeunes aux plus agés. Ainsi nous saurons si en entrainant le modèle il n'y a pas eu une sureprésentation d'une tranche d'age, d'un genre, d'une couleur de peau ou d'un type de réactions face à un intervenant. ### Usages détournés >Nous devons nous rappeler que notre application pourrait être utilisée de façon malveillante notamment par les entreprises qui font de la publicité ou diffusent des contenus en ligne et qui veulent connaitre notre réceptivité à un message publicitaire ou autres. Le risque étant de ne voir que les publicités et informations auxquelles nous sommes susceptibles de réagir et donc de fermer l'internaute à une pluralité d'informations ou de produits proposés. ### Fuite de données ***Choisissez** la proposition qui s'applique le mieux selon vous concernant votre **jeu de données**:* > **🔓 Open source:** Nous avons décidé de rendre public et accessible à tous notre jeu de données d'entrainement, mais avant, nous avons pris les précautions suivantes : vérouiller le dataset afin que les individus restent anonyme. En effet, leurs réactions et indirectement leur attrait pour différents sujets doivent rester confidentiels à nos yeux. ### Piratage > Si une personne trouvait un moyen de "tromper" notre modèle et modifier son comportement à volonté, le risque serait que des évaluations basées sur l'attention des étudiants en cours puissent récompenser des étudiants qui n'ont pas été attentifs mais ont simplement fait semblant.