Weeknotes #7 - HackMD

--- tags: weeknotes --- Weeknotes #7 ============ ## Dataviz @mat@mapstodon.space a déniché un super jeu de données publié par le ministère de la transition écologique sur le parc de véhicules automobiles avec des infos par commune : https://www.statistiques.developpement-durable.gouv.fr/donnees-sur-le-parc-de-vehicules-en-circulation-au-1er-janvier-2022. Il en a tiré une carte de France des propriétaires de camping-car https://mapstodon.space/@mat/109943509032624171. La visualisation par hexagone est super élégante. Pour ceux qui ne connaissent pas @mat, je recommande d'aller voir son site : https://mtmx.github.io/. ## Datatools Dernier né des petits outils en ligne de commande pour manipuler des csv, voici [qsv](https://github.com/jqnatividad/qsv), un fork de [xsv](https://github.com/BurntSushi/xsv) qui ajoute pas mal de fonctionnalités. J'ai pas encore testé qsv mais xsv est vraiment pas mal. C'est écrit en Rust donc c'est très rapide. Je maintiens une liste d'outils libres pour manipuler des données: https://github.com/pachevalier/datatools. C'est souvent pratique pour recommander un outil à quelqu'un qui me pose une question. ## Pandas et Arrow Pandas 2.0 s'appuie désormais sur Apache Arrow. Ça permet d'accélérer un grand nombre de traitements et ça facilite l'interoperabilité avec d'autres langages ou systèmes. Voir l'article https://datapythonista.me/blog/pandas-20-and-the-arrow-revolution-part-i Ça fait des années que Wes McKinney, le développeur à l'origine de Pandas, se consacre à Arrow. Pendant longtemps je ne comprenais pas trop ce que c'était. Il semble que maintenant ce soit mûr et que ça va accélérer à la fois les traitements en R et en python. Je recommande aussi le chapitre https://r4ds.hadley.nz/arrow.html. ## Weeknotes * La weeknote de @tk https://11d.im/semaines/2023w09/