# Processing with AI ## Partie 2: 👩‍⚖️ Ethics of AI Nom - Prénom : > Lo > Isabelle Sujet : > Améliorer le match entre les utilisateurs d'une appli de rencontre, via l'apprentissage et la classification des photos & mots clés >[TOC] ## Cahier des charges ### Biais Si notre jeu de données n'est pas conçu avec suffisamment de rigueur, les biais suivant risquent d'apparaître : >1. a un défaut d'identification faciale ou corporelle : l'utilisateur a tendance à matcher des femmes très minces, tombe sur une femme très corpulente >2. b un profil non pertinent pour l'utilisateur >3. c l'appli fait face à une nouvelle catégorie qu'il ne reconnaît pas Nous allons donc nous assurer que notre modèle n'est pas biaisé en : >1. Apprenant les mots clés associés aux photos sur Mobilenet, mais aussi via notre base de donnée La machine va aussi apprendre via les profils précédemment rejetés >2. Les match sur les applis de rencontre se basent beaucoup sur les photos. Il faut s'assurer que nos données prennent bien en compte la couleur / angle / typologie de la photo, d'où une certaine ressemblance entre les photos ex : une utilisatrice qui met des memes, a plus de chance de matcher avec un utilisateur qui met des memes Ex : une utilisatrice qui met des photos assez provocatives, va voir défiler des profils d'utilisateurs qui montrent beaucoup leur muscles >3. Que la machine apprenne la ressemblance de non seulement des profils matchés mais aussi rejetés : il est plus important d'éviter les profils non pertinents que de proposer des profils très intéressants. Au bout de 5 profils rejetés, la machine va apprendre la ressemblance des photos & catégories, et va sauter ce type de profil Ex : l'utilisatrice a sauté 5 profils avec des photos en boîte de nuit, les autres profils avec des photos en boîte ne seront beaucoup moins proposés ### Overfitting Nous allons nous assurer que notre modèle ne sera pas dans une situation de sur-apprentissage (overfit) en : > Vérifiant la précision de notre modèle en demandant à l'utilisateur pourquoi le profil proposé n'a pas été pertinent (au bout du 5è refus sur des profils filtrés puis proposés), les réponses se feront sous forme de mots-clés pour que la machine apprenne Ex : pourquoi ce profil ne t'intéresse pas ? #poils #moustaches ### Usages détournés >Nous devons nous rappeler que notre application pourrait être utilisée de façon malveillante par des utilisateurs malintentionnés pour de l'escroc, les profils avec des photos très ressemblants ou identiques aux profils signalés auront une attention particulière ou seront moins proposés aux utilisateurs ### Fuite de données ***Choisissez** la proposition qui s'applique le mieux selon vous concernant votre **jeu de données**:* > **🔐 Closed source:** Dans un scénario catastrophe, au cours duquel l'entièreté de notre jeu de données d'entrainement serait volé ou récupéré à partir de notre modèle, le risque serait que l'utilisateur perd confiance : l'appli de rencontre a accès à des information beaucoup plus confidentiels que d'autres type d'appli, personne a envie qu'on diffuse de manière publique qu'il est maso. Cette fonctionnalité AI est aussi une clé de réussite pour l'appli, il faut aussi éviter les autres appli de s'en inspirer. **OU** > **🔓 Open source:** Nous avons décidé de rendre public et accessible à tous notre jeu de données d'entrainement, mais avant, nous avons pris les précautions suivantes : … ### Piratage > Si une personne trouvait un moyen de "tromper" notre modèle et modifier son comportement à volonté, le risque serait la dégradation du service et de son écosystème. Vu que les appli de rencontre ne vérifient pas l'identité de l'utilisateur, la plateforme peut seulement se corriger à travers des signalements reçus. Par exemple rendre la création de compte plus complexe, comme des identifications faciales selon les suites d'utilisation (3 fois sur 10 par exemple). Ou de mettre au moins 3 photos de soi sur son profil et de faire min 50 mots de présentation.