# Introduction > "Une machine ultra-intelligente pourrait dépasser de loin toutes les activités intellectuelles de n'importe quel homme (...) et concevoir (...) des machines encore meilleures. Il y aurait dès lors une « explosion d'intelligence », et l'intelligence de l'homme serait laissée loin derrière. Ainsi, la première machine ultra-intelligente est la dernière invention que l'homme doit faire, à condition que la machine soit assez lucide pour nous dire comment la garder sous contrôle."[^good_speculations_1694] L'explosion d'intelligence prédite en 1962 par le statisticien Irving John Good (1916-2009) postule un emballement de l'innovation causée par des machines de plus en plus sophistiquées qui pourront en créer d'autres sans fin. Cette augmentation exponentielle de l’intelligence parfois nommée "singularité technologique" correspond à une discontinuité radicale dans l'évolution technologique. En 2014, après plusieurs années de désillusions concernant le potentiel de l'intelligence artificielle (IA), Stephen Hawkins (1942-2018) déclare : > "Le développement d’une intelligence artificielle complète pourrait mettre fin à l’humanité. Une fois que les hommes auront développé l’intelligence artificielle, celle-ci décollerait seule, et se redéfinirait de plus en plus vite. Les humains, limités par une lente évolution biologique, ne pourraient pas rivaliser et seraient dépassés." Qu'en est-il réellement ? Pouvons-nous réellement qualifier les machines d'*intelligentes* ? Depuis les années 1980 et la démocratisation des ordinateurs personnels, la quantité de données disponible croît de façon exponentielle. Les données massives ou “Big Data” du XXI<sup>ème</sup> siècle veulent repousser les limites de la science et de l'intelligence. De nombreux scientifiques, médecins, ingénieurs, juristes et citoyens s'inquiètent de la mise en données de leurs vies et de ses conséquences[^interhop_signataires_nodate]. Un "coup data" s'abat sur le monde - pour reprendre l'expression d'Adrien Basdevant, avocat spécialiste des données, qui suggère la mise en place de "principes d’éthiques, de régulations juridiques et de gouvernance pour s’en prémunir"[^basdevant_empire_2018]. Nous le verrons, les données de santé à l'ère de l'informatique et des données massives sont centrales. Elles représentent un enjeu à la fois culturel, scientifique, médical, technique, économique et politique. Elles nous obligent à investir un terrain d’analyse où se rencontrent histoire, épistémologie, sociologie, technologie, écologie et éthique. Cette thèse propose une approche critique et historique des enjeux de la recherche scientifique pour mieux comprendre ses implications au XXIème siècle. Dans une mission parlementaire rendue en 2018, le mathématicien et député Cédric Villani affirme[^villani_donner_2018] : > [il n'est pas] question de remplacer les médecins par la machine, l'enjeu est bien d'organiser les interactions vertueuses entre l'expertise humaine et les apports de l'intelligence artificielle dans l'exercice quotidien de la médecine. L’utilisation de données est inhérente à la démarche scientifique. Depuis des dizaines d’années, elles sont au centre d’une médecine basée sur les preuves. Cependant celles-ci n’ont fait disparaître les erreurs diagnostiques, ni la difficulté d’appliquer des résultats de la recherche vers la pratique clinique. Telle est la prétention de l’IA appliquée à la médecine. Les dossiers médicaux informatisés entraîne la production de grandes quantités de données cliniques numériques[^ross_big_2014] et l'innovation guidée par l'exploration des données de santé est susceptible de jouer un rôle important[^zhang_application_2016]. En effet, le “big data” en santé vise à diminuer la morbi-mortalité, à améliorer les pratiques cliniques, à permettre une médecine personnalisée et à guider les systèmes d'alerte précoce, ainsi qu'à enrôler facilement une cohorte multicentrique importante, tout en minimisant les coûts. Cette thèse a pour ambition de présenter un état des lieux des big data en santé, de donner des pistes de réflexions et d'encourager l'invention médicale et technologique, en incluant les principes de vie sociale et la liberté individuelle. *[invention]: Acte de développer quelque chose de nouveau qui résout un problème <!-- Introduction --> [^good_speculations_1694]: Speculations Concerning the First Ultraintelligent Machine, John Irving Good [^cellan-jones_hawking_2014]: Hawking: AI could end human race [^interhop_signataires_nodate]: Signataires d'une tribune parue dans le Monde "Pour des données de santé au service des patients" [^basdevant_empire_2018]: [L'empire des données, Adrien Basdevant et Jean-Pierre Mignard ](https://www.laprocure.com/empire-donnees-essai-societe-algorithmes-loi-adrien-basdevant/9782359496352.html) [^villani_donner_2018]: [Cédric Villani, Marc Schoenauer, Yann Bonnet, Charly Berthet, Anne-Charlotte Cornut, et al. Donner un sens à l’intelligence artificielle : Pour une stratégie nationale et européenne. Mission Villani sur l’intelligence artificielle, 2018, Yann Bonnet, Secrétaire général du Conseil national du numérique, 978-2-11-145708-9. hal-01967551](https://hal.inria.fr/hal-01967551/document) [^ross_big_2014]: [M. K. Ross, W. Wei, L. Ohno-Machado, “”Big data” and the electronic health record,” Yearb Med Inform, vol. 9, pp. 97–104 (2014 Aug). PMID: 25123728](https://www.ncbi.nlm.nih.gov/pubmed/25123728) [^zhang_application_2016]: [Y. Zhang, S. L. Guo, L. N. Han, T. L. Li, “Application and Exploration of Big Data Mining in Clinical Medicine,” Chin. Med. J., vol. 129, no. 6, pp. 731–738 (2016 Mar)](https://www.ncbi.nlm.nih.gov/pubmed/?term=Application+and+Exploration+of+Big+Data+Mining+in+Clinical+Medicine%2C)