# Processing with AI - AP
## Partie 2: 👩⚖️ Ethics of AI
Nom - Prénom :
> Perraud - Alexandre
>
Sujet :
> Improve dating apps matching algorithms using **NLP**
>[TOC]
## Cahier des charges
### Biais
Si notre jeu de données n'est pas conçu avec suffisamment de rigueur, les biais suivant risquent d'apparaître :
>1. Selon les expressions, le logiciel pourrait se tromper de géolocalisation
>2. Trop de fautes d'orthographe peut ammener à penser qu'un bot écrit à la place d'un utilisateur
>3. Ne pas comprendre les spécificités des profils et réaliser un mauvais matchmaking
Nous allons donc nous assurer que notre modèle n'est pas biaisé en :
>1. Identifiant la manière de parler et les expressions en les catégorisants par région
>2. Faire la distinction entre une machine et un utilisateur
>3. Bien comparer et regrouper les utilisateurs en fonction des spécificitées indiquées
### Overfitting
Nous allons nous assurer que notre modèle ne sera pas dans une situation de sur-apprentissage (overfit) en :
> Utilisant la/les data base(s) les plus adaptées et complètes
> En réalisant une cross-validation
> En effectuant un early-stopping
### Usages détournés
>Nous devons nous rappeler que notre application pourrait être utilisée de façon malveillante par des personnes mal intentionées pour communiquer avec de jeunes personnes innocentes et les rencontrer par la suite.
### Fuite de données
***Choisissez** la proposition qui s'applique le mieux selon vous concernant votre **jeu de données**:*
> **🔐 Closed source:** Dans un scénario catastrophe, au cours duquel l'entièreté de notre jeu de données d'entrainement serait volé ou récupéré à partir de notre modèle, le risque serait que l'intégralité des informations concernant nos utilisateurs (géolocalisation, âge, activités, orientation sexuelle) ne fuitent et entraine un non respect du RGPD
### Piratage
> Si une personne trouvait un moyen de "tromper" notre modèle et modifier son comportement à volonté, le risque serait que les propositions de matchmaling soient complètement erronées, où pire encore que cette personne récupèrent les informations d'utilisateurs en particuliers à des fin malveillantes