Weeknotes #3: ChatGPT et miscellanées

--- tags: weeknotes, chatgpt --- Weeknotes #3: ChatGPT et miscellanées =========== @bzg suggère de créer un vrai blog (https://mastodon.social/@bzg@pouet.chapril.org/109766128721179489). Pour le moment, j'ai encore un peu la flemme et hackmd me permet de me concentrer juste sur le contenu et surtout de contribuer facilement depuis mon téléphone. ## ChatGPT encore et toujours ### Modèle ou produit ? Depuis le début, je me demandais pourquoi le lancement de Galactica par Facebook avait été un énorme fail et le lancement de ChatGPT 10 jours plus tard une énorme hype. J'ai mis du temps à comprendre qu'il y avait une énorme différence. Galactica est un modèle d'IA pur avec une démo alors que ChatGPT est un produit grand public. Au dessus du modèle algorithmique de ChatGPT, il y a en fait un énorme travail humain pour éviter les réponses les plus absurdes et les plus problématiques. C'est tout le travail de modération des contenus toxiques documenté par l'enquête de Billy Perrigo dans le Time (https://time.com/6247678/openai-chatgpt-kenya-workers/). Ce sont aussi toutes les réponses très formattées qu'on a pu voir dans les expériences des uns et des autres: "En tant que programme informatique, je n'éprouve pas de sentiments", "En tant que programme informatique, je n'ai pas de biais". On voit bien que ces formulations ne sont pas générées par l'IA elle même mais sont codées directement par les humains. On apprend aussi qu'OpenAI a engagé 1000 sous-traitants dont 400 programmeurs pour apprendre à ses modèles à coder (https://mamot.fr/@casilli/109765869360834754). ### Toujours plus absurde OpenAI publie un classifieur qui estime la probabilité que le texte soit généré par une IA. Évidemment, il arrive que le classifieur lui-même dise n'importe quoi. Par exemple il considère que les paroles de ABBA sont probablement générées par une IA: https://sfba.social/@adrake/109786536278062889 ### L'exemple parfait Nicolas Roussel a trouvé l'exemple parfait. Quand on demande à ChatGPT comment ramasser les oeufs d'une vache, ChatGPT répond tranquillement qu'il faut bien se laver les mains. https://www.linkedin.com/posts/rousselnicolas_comme-beaucoup-dentre-vous-jai-un-peu-activity-7024483260747378688-xtpz/ C'est le meilleur exemple pour montrer qu'il ne faut pas confondre un générateur de langage avec un modèle de connaissance. Il n'y a pas de base de connaissance derrière ChatGPT, juste des enchaînements de mots plus ou moins probables. ### Ne pas nourrir la bête Depuis le début, c'était assez évident pour moi de ne pas me créer des comptes et faire des requêtes pour ne pas nourrir la bête. Chaque requête que l'on envoie à ChatGPT leur permet d'affiner leur produit, d'améliorer leur modèle, etc. Tout est stocké sur leur serveur et on n'a aucun droit d'effacer les données envoyées. Je suis assez étonné du fait que beaucoup de gens ne semblent pas se poser cette question et jouent avec ChatGPT. ### Le plus grand générateur de bullshit de tous les temps Sayash Kapoor et Arvind Narayanan definissent ChatGPT comme le meilleur générateur de bullshit de tous les temps. > The philosopher Harry Frankfurt defined bullshit as speech that is intended to persuade without regard for the truth. By this measure, OpenAI’s new chatbot ChatGPT is the greatest bullshitter ever. https://aisnakeoil.substack.com/p/chatgpt-is-a-bullshit-generator-but ## Open data Suite à des demandes d'Alexandre Léchenet, le ministère de l'éducation nationale publie les données de l'indice de position sociale des écoles, des collèges et des lycées : https://mastodon.social/@madadafr@mamot.fr/109802878623076751 ## Miscellanées L'économiste Michael Zemmour utilise l'outil LexImpact (qui s'appuie lui-même sur OpenFisca) pour étudier certains effets de la réforme des retraites sur des cas types : https://blogs.alternatives-economiques.fr/zemmour/2023/02/03/hausse-du-minimum-contributif-combien-de-vrais-faux-gagnantes. Très cool de voir ces communs numériques réutilisés dans le débat public. Le Parisien a publié un quizz cartographique sur les stations de métro parisiennes: https://www.leparisien.fr/paris-75/carto-quiz-savez-vous-situer-les-stations-du-metro-parisien-03-02-2023-S6SDJBCTBBGQBF3ANGOCSF2ITQ.php. J'ai pas trop réussi à descendre sous les 10 000 mètres mais j'imagine que les résultats dépendent pas mal de la machine qu'on utilise. Avec un téléphone, on n'est pas très précis mais avec un ordi on est un peu obligé de scroller. L'association Infoclimat a maintenant son compte sur Mastodon: https://mastodon.social/@Infoclimat@piaille.fr Dans Very Good Trip, Michka Assayas rend hommage à Jeff Beck. Redécouvrir des morceaux qu'on n'a pas écoutés depuis 10 ou 15 ans est une sensation incroyable: https://www.radiofrance.fr/franceinter/podcasts/very-good-trip/very-good-trip-du-mardi-24-janvier-2023-3813114 Daniel Schneiderman arrête de présenter son émission hebdo. Quand j'étais ado, j'aimais bien cette émission et c'était une des rares émissions de la télé de l'époque qui permettait de se forger un esprit critique. Après, j'ai suivi le lancement sur internet avec le BigBangBlog et la création du média en ligne Arrêt sur images et ces dernières années, j'ai recommencé à suivre cette émission. La perséverance et la constance de Daniel Schneiderman sont assez impressionnantes: https://www.arretsurimages.net/emissions/arret-sur-images/daniel-schneidermann-27-ans-demissions-de-critique-mediatiqu