Processing with AI ## Partie 2: đŸ‘©â€âš–ïž Ethics of AI Nom - PrĂ©nom : Schmitz Emilien Sujet : Detect rare diseases in medical results (blood tests, MRI, radiology, etc.) using Machine Learning >[TOC] ## Cahier des charges ### Biais Si notre jeu de donnĂ©es n'est pas conçu avec suffisamment de rigueur, les biais suivant risquent d'apparaĂźtre : 1. **Biai de lien de causalitĂ© entre les donnĂ©es** et la maladie **Exemple** : Le programme pourrait diagnostiquer du diabĂšte en relevant le taux de fer. Cette erreur pourrait provenir du fait que la plupart des diabĂ©tiques du jeu de donnĂ©es ont un taux de fer Ă©levĂ© alors que cela n'a aucun lien de causalitĂ© avec le diabĂšte. 2. **Biai de discrimination des maladies** **Exemple** : Une maladie rare non reprĂ©sentĂ©e dans le jeu de donnĂ©es pourrait ne pas ĂȘtre dĂ©tectĂ© par le programme. Il faut donc un jeu de donnĂ©es soit assez important pour couvrir le nombre maximum de maladies. 3. **Biai de discrimination des populations** **Exemple** : Un jeu de donnĂ©es concentrĂ© sur une population gĂ©ographique, sur un genre ou sur un Ăąge pourrait passer Ă  cĂŽtĂ© de maladies. **Au niveau gĂ©ographique**, les maldadies sont inĂ©galement rĂ©parties sur Terre. **Au niveau des genres**, des maladies peuvent ĂȘtre plus prĂ©sentes chez les hommes que chez les femmes et inversement voir absente dans un genre comme pour l'endomĂ©triose (ne touchant que les femmes). **Au niveau de l'Ăąge**, les maladies infantines et les maladies liĂ©es Ă  la vieillesse pourraient ĂȘtre ignorĂ©es si le jeux de donnĂ©es et mal rĂ©parties. Nous allons donc nous assurer que notre modĂšle n'est pas biaisĂ© en : 1. Sourçant nos donnĂ©es depuis des sources mĂ©dicales sures tels des hopitaux, des cliniques, des professionnels de santĂ© ou des associations mĂ©dicales. En bref, provenant d'une institution mĂ©dicale fiable. 2. S'assurant que nos donnĂ©es prennent en compte les biais de discrimination en se basant sur un jeux variĂ© et bien rĂ©parti en termes de population gĂ©ographique, d'Ăąge et de genre. 3. S'assurer d'avoir un jeu de donnĂ©es complet couvrant le nombre de maladies rares le plus vaste possible. ### Overfitting Nous allons nous assurer que notre modĂšle ne sera pas dans une situation de sur-apprentissage (overfit) en : Testant le modĂšle sur diffĂ©rentes maladies pour repĂ©rer si ce dernier trouve le bon lien de causalitĂ© entre les symptomes du patients et la maladie du patient. ### Usages dĂ©tournĂ©s Nous devons nous rappeler que notre application pourrait ĂȘtre utilisĂ©e de façon malveillante : * **ScĂ©nario 1 (moins pessimiste)** :Si un assureur mettait la main sur ce jeu de donnĂ©es, il pourrait les utiliser Ă  des fins commerciales vis Ă  vis de ses clients ou pour prospecter des nouveaux clients. * **ScĂ©nario 2 (plus pessimiste)** : Les donnĂ©es ont Ă©tĂ© rendues publiques par un coeur. Ainsi de nombreuses entreprises se sont emparĂ©es des donnĂ©es et pourraient s'en servir commme d'un critĂšre d'embauche en Ă©vitant des personnes atteintes de maladies graves voire en licenciant ces personne si elles se trouvent dĂ©jĂ  dans l'entreprise. ### Fuite de donnĂ©es **🔐 Closed source:** Dans un scĂ©nario catastrophe, au cours duquel l'entiĂšretĂ© de notre jeu de donnĂ©es d'entrainement serait volĂ© ou rĂ©cupĂ©rĂ© Ă  partir de notre modĂšle, le risque serait que les informations mĂ©dicales des personnes du jeu de donnĂ©es soit utilisĂ©es Ă  des fins commerciales, sortant d'un milieu mĂ©dical. Un vĂ©ritable sujet de sĂ©curitĂ© de donnĂ©es sensibles est soulevĂ©e et nous pourrions ĂȘtre punis pĂ©nalement pour ne pas avoir assurer la confidentialitĂ© de donnĂ©es sensibles. En France, les catĂ©gories de donnĂ©es personnelles sensibles sont limitativement Ă©numĂ©rĂ©es par la loi Informatique et LibertĂ©s du 6 janvier 1978 (article 8). Il s’agit des donnĂ©es faisant apparaĂźtre ou concernant : * Les origines raciales ou ethniques ; * Les opinions politiques, les convictions religieuses ou philosophiques ; * L’appartenance syndicale ; * La santĂ©; * La vie sexuelle. **Le traitement de donnĂ©es sensibles est interdit par la loi Informatique et LibertĂ©s** (article 8), sous peine de sanctions pĂ©nales allant **jusqu'Ă  5 ans d'emprisonnement et 300 000 € d'amende**. ### Piratage Si une personne trouvait un moyen de "tromper" notre modĂšle et modifier son comportement Ă  volontĂ©, le risque serait que des patients soient que le diagnostic mĂ©dical soit faussĂ©. **Deux cas sont Ă  mettre en lumiĂšre :** 1. Une personne pourrait ĂȘtre diagnostiquĂ©e d'une maladie grave qu'elle n'a pas en rĂ©alitĂ©. Des traitements lourds et inutiles pourraient ĂȘtre intentĂ©es sur un patients, pouvant entraĂźner des effets secondaires irrĂ©versibles et des maladies iatrogĂšnes. 2. Une personne rĂ©ellement atteinte par une maladie rare pourrait ne pas ĂȘtre diagnostiquĂ©e Ă  temps, ce qui peut mettre sa vie en danger.