---
title: Le Filtre
description : Fil de nouvelles lues et filtrées, pour bibliothécaires et enseignants, pour une société de l'information plus robuste
image: https://live.staticflickr.com/65535/49521301121_d746cf7cc6_o.png
###### tags: `le_filtre`
tags : filtre, workoutloud, wol
lang: fr
---

:::info
**Quoi ?** Fil de nouvelles lues et filtrées avec soin, pour bibliothécaires et enseignants.
**Pourquoi ?** Si je les stocke dans mes bibliothèques Zotero ou Obsidian, je vais les oublier. Alors je les partage pour 1) vous faire gagner du temps 2) retenir les informations un peu mieux; 3) suivre la mode du « travailler à haute voix » ou [#workingoutloud](https://workingoutloud.com/blog/the-5-elements-of-working-out-loud-revisited).
**Comment ?** Périodicité irrégulière. Pérennité pas garantie. En quelques lignes et en Markdown.
$$information \approx café \Rightarrow percolé \cap filtré$$
:::
## 2025-09-04
- Jedi Valérie : Bravo! La Force est avec toi! Tu as passé le test du précédent billet. Voici une solution :
- On part en padawan sur [Google Scholar](https://scholar.google.ca/scholar?start=30&q=%22skywalker+ranch%22&hl=fr&as_sdt=0%2C5&inst=3940701053777478036) avec des guillemets carrées.
- On repère ce [mémoire](https://cdr.lib.unc.edu/concern/masters_papers/3f462f67n) qu'on parcourt avec Ctrl+F "Library" et avec Yoda sur le dos.
- Ça nous conduit à un lien qui ne fonctionne [plus](https://ilovelibraries.org/article/lucasfilm-research-library ), mais on utilise la technique [nécromantique](https://web.archive.org/web/20160322004756/http://www.ilovelibraries.org/article/lucasfilm-research-library) de rappel à la vie des liens morts et on trouve : « We use modified Dewey to catalog books, and a FileMaker database ».
- [Google AI Overview](https://www.searchenginejournal.com/google-antitrust-case-ai-overviews-use-fastsearch-not-links/555220/) n'utilise pas les liens mais un LLM indépendant «pour aller plus vite».
- Le PageRank (basé sur les citations de liens et qui a fait le succès planétaire de Google) n'est plus le coeur de Google.
- Il a fallu une action en justice pour ouvrir (un peu) la boîte noire.
- Dans les choix conception des Chat_LLM_machins, les capacités de traitement sont très limitées. Ce qui est priorisé est «l'expérience utilisateur», pas la capacité de chercher dans de gros volumes de données. On est loin du AND booléen capable de traiter des millions de données dans un index en une fraction de secondes. #TeamBooléen
- Utiliser Google sans tous les gadgets : https://udm56.com/ (rien à voir avec l'UdeM)
- Dans mes formations « Une fois » (One-Shot), j'ai une diapositive sur la recherche de documents par IAg. Je n'en parle que dans les cycles supérieurs après avoir demandé au prof s'il est OK. L'un des messages principaux est « maintenant, tout le monde sait que les IAg hallucinent des références CEPENDANT le nouvel enjeu est : la référence existe et l'information synthétisée tient la route MAIS l'information synthétisée ne se trouve pas dans la référence». Pour les classiques, on pourrait dire "Tomber de Charybde en Scylla" : Le premier est dangereux et évident, le deuxième est encore [pire](https://irisvanrooijcogsci.com/2025/08/12/ai-slop-and-the-destruction-of-knowledge/) car moins visible.
- Petite réflexion intéressante sur le parallèle à faire entre le [jeu d'échec et l'IAg](https://www.plagiarismtoday.com/2025/07/17/what-chess-teaches-about-academic-integrity/).
- Trucs et astuces :
- [Chicago 18](https://www.zotero.org/styles?q=chicago%2018) est (enfin) arrivé dans Zotero. Plein de saveurs différentes.
- Wikipédia en français : dans le cas des contributions sans compte, un compte [temporaire](https://fr.wikipedia.org/wiki/Wikip%C3%A9dia:Compte_temporaire) de 90 jours est créé (fini l'adresse IP visible, qui est désormais cachée et seulement disponible à certains [admins](https://www.mediawiki.org/wiki/Trust_and_Safety_Product/Temporary_Accounts/FAQ#Why_are_you_working_on_temporary_accounts_at_all?)).
- Citer et vérifier avec la source papier >> électronique (cf. le cas estival de la «[modification](https://techcrunch.com/2025/08/06/key-sections-of-the-us-constitution-deleted-from-governments-website/)» du texte de la Constitution US sur le site web). #TeamHistorien
- Une des raisons invoquée serait un problème dans le XML.
- Or, un peu plus tard cet été, une [bataille](https://thenewstack.io/xslt-debate-leads-to-bigger-questions-of-web-governance/) a commencé pour sauvegarder le [XSLT](https://www.xml.com/articles/2017/02/14/why-you-should-be-using-xslt-30/) (=la feuille de style qui présente un joli rendu d'un fichier XML dans un navigateur). Beaucoup de sites utilisent cette technique : le [gouvenement américain](https://simonwillison.net/2025/Aug/19/xslt/), les podcasteurs indé avec leurs fils [RSS](https://lwn.net/Articles/1034560/), et... pas mal de projets en [humanités numériques](https://programminghistorian.org/en/lessons/transforming-xml-with-xsl). *Sic transit gloria mundi...*
## 2025-06-20 Le Filtre Spécial été
- Suggestion de lecture : la bande dessinée [*La bibliomule de Cordoue*](https://umontreal.on.worldcat.org/oclc/1382540708), que toute personne suivant le Filtre devrait avoir lu, voire avoir offert à son entourage. C'est mon coup de coeur de l'année :heart: .
- La perle de *PubPeer* du moment : après la souris-aux-grosses-noisettes générée par l'IA voici la carte géographique qui pique les yeux, *peer-reviewed* par Elsevier. Je vous laisse [admirer](https://pubpeer.com/publications/68ADF6AF369833DED5462A974E92F0).
- Evaluer ses sources, oui. Pour ceux qui s'arrêtent à l'évaluation de l'auteur voici 4 principes simples pour repérer les [experts louches](https://theconversation.com/when-it-comes-to-health-information-who-should-you-trust-4-ways-to-spot-a-dodgy-expert-253437).
- Lecture (sérieuse et OA) de plage : *Le mouvement Wikimédia au Canada*, j'aime particulièrement le [chapitre de Miguel Tremblay](https://www.parcoursnumeriques-pum.ca/13-wikimedia/chapitre6.html) sur les données ouvertes de Météo Canada.
- Lors du vernissage du livre, j'avais posé la question de l'impact de l'IA générative sur le bénévolat Wikimédien. L'actualité de la semaine vient apporter un autre élément de réponse avec le rejet de l'IA générative par les contributeurs bénévoles de [iNaturalist](https://pivot-to-ai.com/2025/06/19/google-bribes-inaturalist-to-use-generative-ai-volunteers-quit-in-outrage/), et de [Wikipédia](https://www.404media.co/wikipedia-pauses-ai-generated-summaries-after-editor-backlash/).
- **Le jeu de l'été** : trouve quel est le **système de classement informatique et de rayonnage** des livres de la bibliothèque du SkyWalker Ranch (c'est le hub technique et artistique des faiseurs de Star Wars).
- Règle 1 : Tous les moyens sont bons. Y compris passer un coup de téléphone, mais c'est la voie de la Force Obscure. Si tu veux faire ça comme un bon Jedi : seulement la souris et le clavier tu utiliseras.
- Règle 2 : M'écrire par courriel ou Teams **en privé** en décrivant brièvement le chemin d'investigation (les « traces »).
- Récompense : votre nom ou votre pseudonyme est cité dans le prochain Filtre par ordre de résolution de l'énigme.
- Niveau de difficulté : Vader.
- [Point de départ suggéré pour les non-initiés et les trekkies](https://www.mintinbox.net/reportages/califonia-tour-inside-skywalker-ranch-lucasfilm/skywalker-ranch-mintinbox-tour/).
## 2025-04-04
- Joli [message](https://info.orcid.org/orcid-still-persistent-still-independent/) d'étape de ORCID après 10 ans de fonctionnement. Une robustesse bienvenue dans ce moment de fragilisation de la science.
- Une [étude](https://www.nature.com/articles/s41599-025-04666-6) estime à 110 000 le nombre de manuscrits copiés par des femmes au Moyen Âge (dont 8000 existent toujours). L'existence même de femmes copistes a longtemps été occultée. *Stat rosa pristina nomine*...
- (astuce trouvée en ligne et de saison) Comment faire des *Easter Eggs* dans ses publications soumises en LaTeX : il est possible de nommer ses clés de citation BibTeX comme on veut, ainsi l'encre générée portera ce label dans le PDF final. Exemple : au lieu de `Totor_2025` on peut choisir `gredins_qui_nous_ont_plagie`.
- Après [OpenScholarQA](https://openscilm.allen.ai/) et [ScholarQA](https://scholarqa.allen.ai/chat), voici [PaperFinderQA](https://paperfinder.allen.ai/chat). Algo et corpus transparents mais dans pas d'export BibTeX/Zotero/Endnote, ni d'ouverture au plugin PubPeer (qui *flag* un peu les études frelatées), ni une exclusion ou un déclassement des revues douteuses.
- Découverte (tardive) dans Obsidian : le panneau de droite "Rétrolien pour..." a une section "Occurrences non liées" où on peut créer très facilement/frénétiquement des liens en cliquant sur le bouton "Lien".
- [Quelques](https://www.newyorker.com/news/the-lede/the-data-hoarders-resisting-trumps-purge) articles [récents](https://www.404media.co/nih-archives-repositories-marked-for-review-for-potential-modification/) présentent le métier des bibliothécaires avec une dimension d'archiviste-conservateur-superhéros d'Alexandrie (qui courre avec les papyrus sous le bras quand le bâtiment est en feu). Ajoutons le *web scrapping* à notre boîte à outils? (c'est plus facile que refaire son plancher ou sa cuisine)
- J'ai soumis une leçon au *Programming Historian* en français, une revue diamant à laquelle les Bib/UdeM participent au financement. Un doctorant en histoire m'avait demandé comment enrichir ses données avec OpenRefine et Wikidata. J'en ai fait cette leçon pour que d'autres profitent des techniques. Elle est en [prépublication](https://pmartinolli.github.io/OpenRefine-Wikidata_ProgHistFr/) sur GitHub.
## 2025-02-28
- L'extension [Zutilo](https://github.com/wshanks/Zutilo) est enfin disponible pour Zotero 7.
- Selon mes spécifications, une contributrice bénévole a codé une extension pour Obsidian qui permet de chercher des mots-clés dans des notes et d'ajouter les tags correspondants (d'après un fichier csv). C'est une excellente initiation à l'utilisation et à la compréhension de la pertinence des thésaurus personnel et des vocabulaires contrôlés. L'extension est en test ici : https://github.com/Mara-Li/obsidian-my-thesaurus (faites une sauvegarde de votre coffre avant de l'utiliser).
- Humanités numériques :
- Autonomie: En HN, on se forme par ateliers, pairs et capsules Youtube. Et parfois, ça demande une motivation et une persévérance intense (surtout pour les logiciels spécialisés ou les méthodes numériques avancées). Jo Guldi l'a dit avant moi mais je l'ai remarqué en personne cette semaine dans une journée d'étude en histoire sur les logiciels de GIS (dont [QGIS](https://qgis.org/)).
- En HN, les articles en libre accès sont plus [cités](https://www.dline.info/ijis/fulltext/v17n1/ijisv17n1_5.pdf).
- La dataviz qui tue : [97 millions d'ISBN](https://phiresky.github.io/isbn-visualization/) dans une carte. Et moi, et moi et moi ? disait Dutronc (dans la dataviz).
- Une idée de projet disciplinaire : faire une liste des revues [diamant](https://diamond.open-archaeo.info/) comme celle-ci en archéologie.
- Un outil IAg expérimental et amusant pour polir et FAIRiser votre PGD : [FAIR GPT](https://chatgpt.com/g/g-BkMR28wlV-fair). [Présentation](https://tilburg.ai/2024/10/fair-gpt/) et [preprint](https://arxiv.org/abs/2410.07108) détaillant cet outil. Rappel: Ne pas verser de contenu confidentiel!
- L'histoire passionnante des [résumés](https://www.nature.com/articles/s42254-024-00741-0) en science.
- NB: Dans les outils IAg, si on demande un [résumé](https://ea.rna.nl/2024/05/27/when-chatgpt-summarises-it-actually-does-nothing-of-the-kind/), alors ce qui est produit le plus souvent est un raccourcissement de texte (pas un résumé). De plus, dans le cas où le modèle est bien entraîné sur le sujet, il est possible que les données d'entraînement prennent le dessus sur le résultat.
## 2025-01-15
- Nouveau joueur dans l'arène des moteurs IAg spécialisés : Après [Undermind](https://undermind.ai) qui a dominé l'automne 2024, voici [OpenScholar](https://openscholar.allen.ai). Ses points forts :
- pas de connexion avec un compte
- transparence du corpus ET des algorithmes utilisés.
- utilisation du texte intégral plus systématique car avec les tests que j'ai fait il m'a trouvé des références inédites.
- Le DOI c'est comme une adresse au centre-ville, c'est cher et [surfait](https://www.doi.org/the-identifier/resources/factsheets/doi-system-and-the-handle-system). Il existe des alternatives comme [w3id](https://w3id.org/) ou [arks](https://arks.org/).
- Histoire de la censure et des citations :
- L'Inquistion aimait barrer les mentions honorifiques "[Érudit et excellent](https://reactormag.com/tools-for-thinking-about-censorship/#:~:text=learned%20and%20excellent)" qu'il était de bon goût de rajouter après avoir cité un auteur dont on réutilisait le travail. Évidemment l'Inquisition ne faisait cela que sur les auteurs protestants. L'Inquisition ne barrait pas le nom, seulement l'accompagnement honorifique.
- Est-ce que les mesures de citation sont des fosses à responsabilités (*[accountability sink](https://dynamicecology.wordpress.com/2024/09/10/citation-metrics-as-accountability-sinks/)*) ?
- Aujourd'hui, c'est l'anniversaire des 24 ans de Wikipédia (un outil capricorne ;-).
- C'est aussi le jour de démarrage du concours amical de contributions 1Lib1Ref/1Bib1Ref Canada 2025 pour rajouter au moins une source à un article de Wikipédia. Les participant.es sont des membres de GLAM/GLAMA/GLAMR/... Si vous voulez participer, cliquez sur https://outreachdashboard.wmflabs.org/courses/Wikimedia_Canada/1Bib1Ref_-_1Lib1Ref_Canada_2025_(January_2025)/home cliquez sur Rejoindre/Join avec votre identifiant Wikimédia (une bonne opportunité pour en créer un). Ensuite dans les commentaires de contribution/Edit summary, ajoutez #1Lib1Ref ou #1Bib1Ref. Il n'y a pas de compétitions entre institutions cette année (rappel : nous étions souvent en haut des palmarès il y a quelques années).
- Si Wikipédia est encore de qualité malgré les attaques, les écosystèmes toxiques du web 2.0 et les biais des contributeurs, c'est (entre autres) grâce à l'accumulation successive de filtres (¡Vivan los Filtros!) : administratifs, technologiques, communautaires, éditoriaux, éducatifs, de transparence, culturels et organisationnels, etc.
## Archives
* [2020](https://hackmd.io/NP9ASNM-TZmluOm6zYG6Gw)
* [2021](https://hackmd.io/ImjF-OlCReyWe_B-k5uYjQ)
* [2022](https://hackmd.io/@pascaliensis/H1VDgASco)
* [2023](https://hackmd.io/@pascaliensis/H1KVYoTF6)
* [2024](https://hackmd.io/@pascaliensis/HkFSJilr1g)
---
:::info
Éditeur : [Pascal Martinolli](http://martinolli.free.fr/), les opinions et la sélection n'engagent que moi.
CC-BY.
:::