Processing with AI

# Processing with AI ## Partie 2: 👩‍⚖️ Ethics of AI Nom - Prénom : > Lombaerde Stéphane > Sujet : > 💕 Improve dating apps matching algorithms using NLP >[TOC] ## Cahier des charges ### Biais Si notre jeu de données n'est pas conçu avec suffisamment de rigueur, les biais suivant risquent d'apparaître : >1. Il existe le risque les photos soient plus importantes pour les utilisateurs dans le choix des matchs. Cela biaiserais notre algorithme, qui ne se baserait que sur les textes dans les profils ou messages privés. >2. Si des personnes ont beaucoup de "succès", mais se comportent mal en message privé, l’algorithme pourrait croire que cela fonctionne et présenter cette personne à d'autres utilisateurs. Nous allons donc nous assurer que notre modèle n'est pas biaisé en : >1. Nous pouvons faire des tests avec profils avec et photo pour vérifier leur "poids" dans la décision de matcher ou non. Néanmoins, nous devons prendre en compte le fait qu'il existe un risque de biais car sans photo, il pourrait y avoir moins de chance de matcher. >2. Essayer de classer des messages équivalents (sur les phrases d’approche par exemple), pour voir quelle probabilité de succès un message peut avoir sur différentes personnes. ### Overfitting > Nous pourrons vérifier l'efficacité de notre modèle en splittant les données avec un training set et un autre de validation. ### Usages détournés > Des personnes mal intentionnées pourraient s’en servir pour savoir quoi écrire en message ou dans leur profil, et rencontrer ainsi plus de gens > Il faudrait s’assurer que personne dans notre organisation ne puisse lire le contenu des messages, ni le nom des profils. ### Fuite de données > **🔐 Closed source: étant donné la confidentialité des messages d’une personne à une autre dans le cadre privé, il est nécessaire de ne pas partager ces données. > De plus, l'anonymisation des données ne suffirait pas : il y a des risques que l’on puisse identifier les personnes. ### Piratage > Je pense que le risque reste assez limité de tromper notre modèle, étant donné qu’il faudrait se coordonner entre la personne qui envoie un message et une autre qui l’aurait matché, et continuerai de répondre ensuite. > Cependant, des situations où des utilisateurs pourraient chercher à tromper notre modèle pourraient survenir. Un risque de seraient de créer de faux compte pour essayer d’améliorer « l’attractivité » d’un profil artificiellement pour ensuite matcher avec plus de personnes dans le but de les spammer.