# Processing with AI
## Partie 2: đ©ââïž Ethics of AI
Nom - Prénom :
> Lombaerde Stéphane
>
Sujet :
> đ Improve dating apps matching algorithms using NLP
>[TOC]
## Cahier des charges
### Biais
Si notre jeu de données n'est pas conçu avec suffisamment de rigueur, les biais suivant risquent d'apparaßtre :
>1. Il existe le risque les photos soient plus importantes pour les utilisateurs dans le choix des matchs. Cela biaiserais notre algorithme, qui ne se baserait que sur les textes dans les profils ou messages privés.
>2. Si des personnes ont beaucoup de "succĂšs", mais se comportent mal en message privĂ©, lâalgorithme pourrait croire que cela fonctionne et prĂ©senter cette personne Ă d'autres utilisateurs.
Nous allons donc nous assurer que notre modÚle n'est pas biaisé en :
>1. Nous pouvons faire des tests avec profils avec et photo pour vérifier leur "poids" dans la décision de matcher ou non. Néanmoins, nous devons prendre en compte le fait qu'il existe un risque de biais car sans photo, il pourrait y avoir moins de chance de matcher.
>2. Essayer de classer des messages Ă©quivalents (sur les phrases dâapproche par exemple), pour voir quelle probabilitĂ© de succĂšs un message peut avoir sur diffĂ©rentes personnes.
### Overfitting
> Nous pourrons vérifier l'efficacité de notre modÚle en splittant les données avec un training set et un autre de validation.
### Usages détournés
> Des personnes mal intentionnĂ©es pourraient sâen servir pour savoir quoi Ă©crire en message ou dans leur profil, et rencontrer ainsi plus de gens
> Il faudrait sâassurer que personne dans notre organisation ne puisse lire le contenu des messages, ni le nom des profils.
### Fuite de données
> **đ Closed source: Ă©tant donnĂ© la confidentialitĂ© des messages dâune personne Ă une autre dans le cadre privĂ©, il est nĂ©cessaire de ne pas partager ces donnĂ©es.
> De plus, l'anonymisation des donnĂ©es ne suffirait pas : il y a des risques que lâon puisse identifier les personnes.
### Piratage
> Je pense que le risque reste assez limitĂ© de tromper notre modĂšle, Ă©tant donnĂ© quâil faudrait se coordonner entre la personne qui envoie un message et une autre qui lâaurait matchĂ©, et continuerai de rĂ©pondre ensuite.
> Cependant, des situations oĂč des utilisateurs pourraient chercher Ă tromper notre modĂšle pourraient survenir. Un risque de seraient de crĂ©er de faux compte pour essayer dâamĂ©liorer « lâattractivité » dâun profil artificiellement pour ensuite matcher avec plus de personnes dans le but de les spammer.