owned this note
owned this note
Published
Linked with GitHub
M5 Intelligence Artificielle - Genèse de l'IA
===
## Séance 01/12
###### tags: `Penninghen` `numérique` `design` `digital` `plan` `ressources`
:::info
- **Location:**
31 Dragon (salles A & B)
- **Contacts:** <t.bucher@penninghen.fr> | <c.salaun@penninghen.fr>
:::
## I. L'IA avant l'IA
Histoire de l'intelligence artificielle : premières manifestations de la cybernétique, automates et avancées technologiques avant l'ordinateur et avant que l'IA ne se nomme IA.
### Le Turc Mécanique (1770)
- **1770** : Wolfgang von Kempelen présente un automate joueur d'échecs à l'impératrice Marie-Thérèse d'Autriche
- **Fonctionnement** : Automate vêtu à la mode ottomane, assis derrière un meuble ouvragé
- **Tournée** : Europe et Amérique, défie Benjamin Franklin et Napoléon Bonaparte
- **Durée** : Plus de 80 ans de fascination publique
- **Révélation (1854)** : L'automate cachait un véritable joueur d'échecs de petite taille
- **Importance** : Première réflexion sur l'intelligence artificielle, préfigure le test de Turing
---
## II. Les fondations scientifiques
### Alan Turing (1912-1954)
- **1935** : À 23 ans, imagine une "machine universelle" capable de résoudre tout problème calculable
- **Contribution** : Invention conceptuelle de l'ordinateur moderne
- **Guerre** : Ses machines brisent Enigma, raccourcissent le conflit de 2 ans
- **Persécution** : Castration chimique pour homosexualité
- **Mort** : Suicide en 1954
### Test de Turing (1950)
- **Question posée** : "Les machines peuvent-elles penser ?"
- **Réponse** : Remplace la question par "peuvent-elles nous faire croire qu'elles pensent ?"
- **Méthode** : Humain dialogue avec machine et humain sans les voir
- **Critère** : Si l'humain ne peut distinguer qui est qui, la machine "réussit"
- **Statut actuel** : Jamais officiellement réussi, ChatGPT s'en approche
### Conférence de Dartmouth (1956)
- **Date** : Été 1956, Dartmouth College, New Hampshire
- **Participants** : Dix chercheurs, atelier de deux mois
- **Innovation** : John McCarthy forge le terme "Intelligence Artificielle"
- **Vision** : Résoudre l'intelligence en quelques décennies
---
## III. L'explosion contemporaine
### Cycles de l'IA
**Périodes d'euphorie :**
- **1960-1974** : IA symbolique
- **1980-1987** : Systèmes experts
- **2010-aujourd'hui** : IA générative
**Hivers de l'IA :**
- **1974-1980** : Premier hiver, financements tarissent
- **1987-1993** : Deuxième hiver, effondrement des systèmes experts
**Schéma récurrent** : Euphorie → Investissements massifs → Désillusion → Hiver de l'IA
### Geoffrey Hinton et le Deep Learning
- **Années 80-90** : Réseaux de neurones considérés comme dépassés
- **2012** : Révolution avec ImageNet, précision inouïe
- **Conséquence** : Explosion du "deep learning", recrutement par Google
- **2023** : Quitte Google, met en garde contre ses créations
### Data Centers
- **Consommation** : Équivalent à un petit pays
- **GPT-3** : Entraîné sur 45 téraoctets de texte (20 millions de livres)
- **Impact CO2** : Entraînement d'un gros modèle = 5 voitures sur leur durée de vie
### Révolution de l'image (2022)
**Outils** : DALL-E, Midjourney, Stable Diffusion
**Fonctionnement** : Génération d'images à partir de descriptions textuelles
**Problématique** : Entraînement sur milliards d'images sans autorisation
### ChatGPT (2022)
- **Lancement** : 30 novembre 2022
- **Adoption** : 1 million d'utilisateurs en 5 jours, 100 millions en 2 mois
- **Comparaison** : Instagram (75 jours), Facebook (10 mois) pour 1 million
- **Impact** : Démocratisation de l'IA, usage quotidien
---
## IV. Les grandes familles d'IA
### IA Réactive
**Caractéristiques** :
- Réponse instantanée sans mémoire
- Oublie tout après chaque interaction
- Exemple : Deep Blue (200 millions de coups/seconde)
- Limite : Pas d'apprentissage de l'expérience
### IA à Mémoire Limitée
**Caractéristiques** :
- Garde quelques souvenirs sélectifs
- Mémoire fonctionnelle (GPS, Tesla)
- IA la plus répandue actuellement
- Optimisation basée sur l'historique
### IA Générative
**Fonctionnement** :
- Recombinaison d'éléments appris
- Ne copie pas, recombine
- Exemple : Midjourney combine fourrure + casque spatial + style artistique
- Ne comprend pas le contenu créé
### Classification par niveau
**ANI (Artificial Narrow Intelligence)** :
- Toutes les IA actuelles
- Excellence dans un domaine, nullité ailleurs
- Exemple : AlphaGo excelle au Go, incapable aux dames
**AGI (Artificial General Intelligence)** :
- Intelligence polyvalente équivalente à l'humain
- Adaptation à tous contextes
- Prédictions : 2030 (optimistes), 2050 (réalistes), jamais (sceptiques)
**ASI (Artificial Super Intelligence)** :
- Dépassement de l'intelligence humaine dans tous domaines
- Capacités théoriques : résolution changement climatique, guérison cancer
- Questionnement : rôle de l'humanité dans ce scénario
---
## V. Les différents niveaux de complexité
**Pyramide de l'évolution IA** :
- **Base** : ANI spécialisées (présent)
- **Milieu** : AGI polyvalente (futur proche)
- **Sommet** : ASI surhumaine (futur lointain)
**Trois voies d'apprentissage** :
- Apprentissage supervisé : fiable, coûteux
- Apprentissage non-supervisé : surprenant, imprévisible
- Apprentissage par renforcement : créatif, chronophage
---
## VI. Les méthodes d'apprentissage
### Apprentissage Supervisé
**Principe** :
- Exemples étiquetés (chat/chien)
- Correction systématique des erreurs
- Méthode la plus fiable mais coûteuse
- Exemple : GPT-4 nécessite annotation de milliards de textes
### Apprentissage Non-Supervisé
**Principe** :
- Données brutes sans étiquettes
- Recherche de patterns cachés
- Découverte de groupes naturels
- Risque : regroupements absurdes (couleur vs contenu)
### Apprentissage par Renforcement
**Principe** :
- Système de récompenses/punitions
- Exploration par essai-erreur
- Exemple : AlphaGo (millions de parties contre lui-même)
- Résultat : invention de stratégies inédites
---
## VII. Panorama des outils IA contemporains
### Génération de Texte
**GPT-4** :
- Créatif, métaphoriques
- Usage : brainstorming, déblocage créatif
**Claude** :
- Analyse rigoureuse, structuration
- Usage : correction, organisation d'idées
**Gemini** :
- Recherche factuelle en temps réel
- Usage : vérification de données
**LLaMA** :
- Open source, modifiable
- Usage : adaptation personnalisée
### Génération d'Images
**Midjourney** :
- Style cinématographique, surréaliste
- Usage : inspiration créative
**DALL-E 3** :
- Précision dans l'exécution
- Usage : création dirigée
**Stable Diffusion** :
- Gratuit, modifiable
- Usage : entraînement personnalisé
**Adobe Firefly** :
- Intégration Photoshop
- Usage : workflow existant
---
## VIII. Qu'est-ce qu'un Dataset ?
### ImageNet
**Composition** :
- 14 millions d'images
- 22 000 catégories
- Créé en 2009 par Fei-Fei Li (Stanford)
**Problématiques découvertes** :
- Catégories problématiques : "fille de joie", "terroriste"
- Biais dans l'annotation
### Cas Tay (Microsoft, 2016)
**Déroulement** :
- Chatbot apprenant sur Twitter
- Programmé comme adolescente bienveillante
- Corruption en 24h par bombardement de messages haineux
- Arrêt d'urgence
**Leçon** : IA dépendante de la qualité des données d'entraînement
### Fonctionnement de l'apprentissage IA
**Étapes** :
1. Présentation d'exemples étiquetés
2. Recherche de patterns statistiques
3. Test sur nouvelles données
4. Évaluation des performances
**Nature** : Statistiques sophistiquées, pas de "compréhension"
### IA généraliste vs spécialisée
**IA généraliste (GPT-4)** :
- Polyvalence
- Consommation énergétique élevée
- Performances variables
**IA spécialisée** :
- Excellence dans domaine ciblé
- Efficacité énergétique
- Performances optimales
### Dataset créatif
**Exemples** :
- "Fonts in Use" : 100 000 typographies classées
- "Color Palettes" : 50 000 harmonies colorées
**Annotations** : "vintage", "corporate", "dramatique"
**Impact** : Façonne l'esthétique du modèle
---
## IX. Exercice pratique : "L'inventaire du visible"
### [Groupes et sujets](https://hackmd.io/pLkke6rFSdqzOKTTswujXA)
---
### Objectif
Création collective d'un dataset de 5000+ éléments.
**Justification du nombre** :
- < 5000 : manque d'exemples pour généralisation
- > 5000 : plus fiable mais plus coûteux
- 5000 : seuil optimal pour IA spécialisée
### Méthodologie
**Organisation** : Groupes de 3 personnes
**Étapes** :
1. **Choix du sujet** : Thématique créative non couverte
2. **Collecte** : 5000+ éléments multimédia
3. **Grille d'annotation** : Catégories de classification
4. **Annotation collaborative** : Étiquetage selon grille
5. **Validation croisée** : Vérification cohérence
6. **Présentation critique** : Analyse des biais
### Thématiques suggérées
- Modèles de Penninghen (plâtres servant de modèles pour le dessin)
- Mise en page
- Typographies expérimentales
- Esthétiques de l'erreur (glitchs, bugs graphiques)
- Matières et textures tactiles
- Éclairages créatifs
- Outils et traces de création
### Objectifs pédagogiques
**Technique** : Compréhension concrète des datasets
**Critique** : Expérimentation des biais
**Créatif** : Développement du regard éditorial
**Collaboratif** : Négociation des critères esthétiques
**Prospectif** : Préparation à l'entraînement de modèle
### Livrables
- Dataset organisé (.csv + fichiers médias)
- Grille d'annotation justifiée
- Rapport d'analyse des biais
- Présentation des choix éditoriaux
- Rendu sur format libre
:::info
Pré-rendu: 30.09
Rendu: 07.10
:::