# Relevé de débats & propositions suite aux premières journées du GT Notebook ## présent⋅es pour le copil ### en entrée Guillaume, Raphaëlle, Pierre, Gloria, Konrad, Émilien, Marc, Sébastien, Nicolas R., Hugues, Nicolas S. (fin de session) ### en sortie Jérémy, Pierre, Nicolas, Elisabeth, Konrad, Timothée, Simon, Paul, Mattia, Raphaëlle, Sébastien, Marc, Hugues, Gloria ### en tout (17) jeremy.tuloup@quantstack.net,pierre.poulain@u-paris.fr,nicolas.roelandt@univ-eiffel.fr,elisabeth.guerard@uni.lu,konrad.hinsen@cnrs.fr,timothee.giraud@cnrs.fr, gloria.gonzalez-curto@inria.fr, simon.tournier@inserm.fr, Paul.Chapron@ign.fr, mattia.bunel@ehess.fr, mc@unistra.fr, hugues.pecout@cnrs.fr, nicolas.sauret, emilien.schultz, guillaume.anciaux # 1 - odj en entrée (sur les réalisations du gt & la suite) yenavaitpas voir les notes ici : https://hackmd.io/fLQHNDIQRPmL7mGXobW0hw?view ## essai de synthèse des notes du copil en entrée des journées ### Sur l'émergence du collectif Le collectif naît de la volonté et de l'engagement d'individus, au sein de plusieurs réseaux interpersonnels ou thématiques, pour la réalisation collective [[concrétisation](#concretisation) & transindividuation] d'un atelier de sensibilisation aux "notebooks", dans le cadre de politiques publiques d'ouverture de la science en train de se faire (les ateliers de la donnée de l'ESR et le réseau recherche reproductible). Il s'agit aussi de convergences rendues possibles entre des *data scientists* de culture dominante *Jupyter* mobilisant le langage Python, d'éditeur⋅ices de méthodes en géographie ou littérature mobilisant le langage R et/ou la syntaxe *markdown* pour l'écriture scientifique, de chercheur⋅ses et enseignant⋅es-chercheur⋅ses et d'informaticien⋅nes ou ingénieur⋅es & technicien⋅nes issu⋅es de diverses communautés disciplinaires, en charge ou non de revues fondées sur des [documents computationnels]. <!-- NR: ajouter des références vers les langages/outils si elles existent ?--> ### Sur la relation à la mémoire (des machines) #### Inscription D'emblée la discussion s'engage sur la question des formats [inscription] de données et l'apport de nouveaux standards [amplification] comme *parket*, *arrow* ou *feather* par rapport aux formats existants. La [comparaison référencée](https://encyclopedia.pub/entry/history/show/83003) - une version du tableau *Comparison of Data Serialization Formats : History* (encyclopedia.pub, s.d.), instancie ces formats (qui sont des opérations de sérialisation) selon plusieurs critères, dont leur désignation nommée, leur créateur, les formats existants sur lesquels ils se fondent, leur standardisation, leur éventuelle spécification. Il s'agit aussi de préciser si ces formats sont de ceux du langage des machines - binaire, ou intelligible pour l'humain, s'ils supportent l'encodage, le décodage ou le référencement ou déréférencement d'autres données dans un même document à partir de processus génériques (éventuellement un fichier IDL, sans plus) et le [schéma IDL](https://www.ibm.com/docs/fr/app-connect/11.0.0?topic=corba-idl-data-types) (voir aussi https://fr.wikipedia.org/wiki/Interface_Description_Language ou https://web.archive.org/web/20230114051644/https://www.l3harrisgeospatial.com/Support/Maintenance-Detail/ArtMID/13350/ArticleID/22338/IDL-87-Release-Notes) associé, ainsi que la possibilité et le type d'accès par des interfaces de programmation d'application (API) et celle de réaliser les opérations *zero copy* entre les espaces de mémoire des utilisateur⋅ices et ceux du noyau de la machine (pour réduire la charge de l'unité centrale de traitement). <!--NR: Que siginifie IDL--> #### Émulation des machines (historiques) dans un navigateur ? ### Sur quelques notions mises en débat au sein du collectif [penser avec Simondon ? un glossaire](https://journals.openedition.org/appareil/2253) [lire avec Xavier Guchet ? objet technique, organologie](https://costech.utc.fr/CahiersCostech/spip.php?auteur11) Trouver "à minima" une liste de [propriétés] et des [autorités] pour des termes tels que *literate programming* [programmation lettrée ou littéraire] et [reproductibillité] est l'un des objectifs de l'atelier relatif à la base de connaissances du collectif. De même, proposer une définition du *notebook* au sens entendu (liste de propriétés et d'autorités) demande au préalable de discuter de la nature de l'objet technique, voire de son mode d'existence. Par exemple, la notion de [programmation lettrée] proposée par (Knuth, 1984) modifie la relation du [programmeur] à la machine en proposant d'y inclure un tiers : il s'agit pour les auteur⋅ices de code informatique d'écrire (au sens littéraire) afin d'expliquer aux êtres humains ce qu'ils ou elles veulent que l'ordinateur fasse. > Let us change our traditional attitude to the construction of programs: Instead of imagining that our main task is to instruct a computer what to do, let us concentrate rather on explaining to human beings what we want a computer to do (Knuth, 1984). La notion de [reproductibilité] associée à la recherche scientifique est d'abord celle d'une crise pour sa communauté dont une majorité semble dans l'incapacité de reproduire les expériences publiées dans ses revues, non seulement par tradition mais aussi à cause du coût associé à une telle démarche. Cette question n'est pas nouvelle et Alexandre Hocquet en propose un point de vue historique, philosophique et sociologique dans le *mooc* dédié (inria, s.d.). Ce qui est nouveau est l'injonction qui y est associée dans le cadre de bonnes pratiques scientifiques, au nom de la crédibilité de la science. Enfin, le [*notebook*] semble polymorphe tant le sujet, lancé au sein du gt fin 2021, ne finit pas de nourrir la réflexion et les débats au sein d'un collectif élargi et en devenir. Plusieurs contributions permettent de proposer au sein du gt des approches différenciées de la notion, notamment celle de (Le Béchec &l., 2024) qui s'inscrit dans une perspective d'études des sciences et techniques, et discute du rôle du *notebook* dans le cadre de la science ouverte ou celles ébauchées au lancement du collectif soit pour tenter de traduire le terme *notebook* (Perret, 2021;Krummeich, 2021) ou dans le cadre du séminaire d'écosophie du numérique proposé par le collectif EVEILLE (Krummeich & al., 2022) mobilisant une expérimentation dans une démarche épistémologique simondonienne. <!-- NR: Construire un glossaire ? Pouvons nous proposer/choisir une traduction pour notebook ? Associée à une définition et des synonymes ? Ou recencer les termes existants ? Par exemple, j'aime bien le terme "carnet numérique" car ça renvoie à une objet réel dont tout le monde a fait l'expérience mais un notebook va au delà du simple carnet. Carnet numérique ne renvoie pas aux capacités d'interactivité/computativité d'un *notebook*. --> ### Sur les liens vers les technologies citées #### Langage ou technologie autour de SmallTalk #### Réaliser des *pipes* dans les langages <!-- Peut-être expliquer ce qu'est un *pipe* ? et que *ceci n'est pas une pipe*... Proposer une(des) traduction(s) ?--> > Le tidyverse est une collection de packages R conçus pour la science des données. Tous les packages partagent une philosophie de conception, une grammaire et des structures de données sous-jacentes (www.tidyverse.org, s.d.). [tidyverse. des pipes dans R](https://www.tidyverse.org/) Pipe UNIX <!-- NR: il y a des pipes dans Python ? --> #### Visualiser des tables de données [datatable? en R](https://rstudio.github.io/DT/) [pandas, le datatable de python](https://pandas.pydata.org/) [datatables en js?](https://datatab.net/) [PDL, le pandas de perl?](https://pdl.perl.org/) [netlogo c'est facile à utiliser](https://ccl.northwestern.edu/netlogo/) [raku et la philo des langages](https://raku.org/) # 2 - journées - programme & réalisations # 3 - odj en sortie (sur les journées & la suite) yenavaitpas voir les notes ici : https://hackmd.io/93hy-4NMRLWd1SoX9mPEhQ **== je rapatrie ce qu'il y a dessous dans les notes du jour 19/05 ==** https://hackmd.io/g1Jfrsn2SlO9d_bFmD4QiQ (je transfere dans le doc du jour Nicolas => https://hackmd.io/g1Jfrsn2SlO9d_bFmD4QiQ )