# Processing with AI ## Partie 2: đ©ââïž Ethics of AI Nom - PrĂ©nom : > Vaquier Pierre > Sujet : > đ AmĂ©liorer l'algorithme des applis de rencontre en utilisant le traitement automatique du langage naturel pour analyser le texte prĂ©sent dans le profil des utilisateurs et dans les conversations privĂ©es. > >[TOC] ## Cahier des charges ### Biais Si notre jeu de donnĂ©es n'est pas conçu avec suffisamment de rigueur, les biais suivant risquent d'apparaĂźtre : >1. Recommendations peu qualitatives pour les personnes avec des centres d'intĂ©rĂȘt et des sujets de discussion peu communs ; >2. Mauvaise prise en compte des prĂ©fĂ©rences des homosexuels dĂ» une prĂ©pondĂ©rence des donnĂ©es liĂ©es Ă des comptes d'hĂ©tĂ©rosexuels ; >3. Faible efficacitĂ© avec les personnes parlant un dialecte français ou une autre langue minoritaire en France (si le jeu de donnĂ©es prend en compte des conversations en français); Nous allons donc nous assurer que notre modĂšle n'est pas biaisĂ© en : >1.Prenant en compte des profils avec une grande diversitĂ© de personnalitĂ© et de goĂ»ts personnels; >2. Sourçant nos donnĂ©es depuis des profils et des conversations de tous les profils composant une sociĂ©tĂ© (LGBT ou autres ethnies) >3. S'assurant que nos donnĂ©es prennent en compte diffĂ©rentes langues ou niveau de langue ; ### Overfitting Nous allons nous assurer que notre modĂšle ne sera pas dans une situation de sur-apprentissage (overfit) en : > VĂ©rifiant la prĂ©cision de notre modĂšle sur des jeux de donnĂ©es provenant de profils issus des minoritĂ©s. ### Usages dĂ©tournĂ©s >Nous devons nous rappeler que notre application pourrait ĂȘtre utilisĂ©e de façon malveillante par un possible gouvernement autoritaire pour stigmatiser des personnes issues de minoritĂ©s ou des opposants politiques. ### Fuite de donnĂ©es > **đ Closed source:** Dans un scĂ©nario catastrophe, au cours duquel l'entiĂšretĂ© de notre jeu de donnĂ©es d'entrainement serait volĂ© ou rĂ©cupĂ©rĂ© Ă partir de notre modĂšle, le risque serait que la vie privĂ©e de millions d'utilisateurs serait baffouĂ©e et divulguĂ©e aux yeux de tous sur internet. Cela permettrait un trafic de donnĂ©es personnelles sur internet, pouvant mener Ă du chantage, Ă des campagnes d'humiliations ou Ă un ciblage publicitaire encore plus prĂ©cis et agressif. Enfin, l'entreprise en charge de l'utilisation de ces donnĂ©es pourrait ĂȘtre poursuivie en justice. ### Piratage > Si une personne trouvait un moyen de "tromper" notre modĂšle et modifier son comportement Ă volontĂ©, le risque serait que l'algorithme se montre inefficace et qu'un grand nombre d'utilisateurs quittent l'application.
×
Sign in
Email
Password
Forgot password
or
By clicking below, you agree to our
terms of service
.
Sign in via Facebook
Sign in via Twitter
Sign in via GitHub
Sign in via Dropbox
Sign in with Wallet
Wallet (
)
Connect another wallet
New to HackMD?
Sign up