# Processing with AI ## Partie 2: đŸ‘©â€âš–ïž Ethics of AI Nom - PrĂ©nom : > Lombaerde StĂ©phane > Sujet : > 💕 Improve dating apps matching algorithms using NLP >[TOC] ## Cahier des charges ### Biais Si notre jeu de donnĂ©es n'est pas conçu avec suffisamment de rigueur, les biais suivant risquent d'apparaĂźtre : >1. Il existe le risque les photos soient plus importantes pour les utilisateurs dans le choix des matchs. Cela biaiserais notre algorithme, qui ne se baserait que sur les textes dans les profils ou messages privĂ©s. >2. Si des personnes ont beaucoup de "succĂšs", mais se comportent mal en message privĂ©, l’algorithme pourrait croire que cela fonctionne et prĂ©senter cette personne Ă  d'autres utilisateurs. Nous allons donc nous assurer que notre modĂšle n'est pas biaisĂ© en : >1. Nous pouvons faire des tests avec profils avec et photo pour vĂ©rifier leur "poids" dans la dĂ©cision de matcher ou non. NĂ©anmoins, nous devons prendre en compte le fait qu'il existe un risque de biais car sans photo, il pourrait y avoir moins de chance de matcher. >2. Essayer de classer des messages Ă©quivalents (sur les phrases d’approche par exemple), pour voir quelle probabilitĂ© de succĂšs un message peut avoir sur diffĂ©rentes personnes. ### Overfitting > Nous pourrons vĂ©rifier l'efficacitĂ© de notre modĂšle en splittant les donnĂ©es avec un training set et un autre de validation. ### Usages dĂ©tournĂ©s > Des personnes mal intentionnĂ©es pourraient s’en servir pour savoir quoi Ă©crire en message ou dans leur profil, et rencontrer ainsi plus de gens > Il faudrait s’assurer que personne dans notre organisation ne puisse lire le contenu des messages, ni le nom des profils. ### Fuite de donnĂ©es > **🔐 Closed source: Ă©tant donnĂ© la confidentialitĂ© des messages d’une personne Ă  une autre dans le cadre privĂ©, il est nĂ©cessaire de ne pas partager ces donnĂ©es. > De plus, l'anonymisation des donnĂ©es ne suffirait pas : il y a des risques que l’on puisse identifier les personnes. ### Piratage > Je pense que le risque reste assez limitĂ© de tromper notre modĂšle, Ă©tant donnĂ© qu’il faudrait se coordonner entre la personne qui envoie un message et une autre qui l’aurait matchĂ©, et continuerai de rĂ©pondre ensuite. > Cependant, des situations oĂč des utilisateurs pourraient chercher Ă  tromper notre modĂšle pourraient survenir. Un risque de seraient de crĂ©er de faux compte pour essayer d’amĂ©liorer « l’attractivité » d’un profil artificiellement pour ensuite matcher avec plus de personnes dans le but de les spammer.