---
title: Atelier SoDUCo-BNF - Séance 2/4 - Annuaires
tags: SoDUCo, Annuaires
robots: noindex, nofollow
langs: fr
---
**Atelier SoDUCo-BNF - Séance 2/4 : Annuaires & Almanachs parisiens - Paris City Directories**
# A- Rappel du le plan général du séminaire SoDUCo-BNF (les 4 séances)
- J1 : Verniquet et exploitation cartes anciennes
- J2 : Annuaires et Almanachs - géocodage
- J3 : Trente ans d’analyses spatiales formalisées.
BNF / University of Chicago / Soduco (EHESS, IGN, EPITA) **à Re-programmer**
- J4 : Dissiminination : Open data / Open tools / Sciences collaboratives ?
Plateformes. "Ateliers - Salon" - Metadonnées
API : data.bnf.fr / Gallica /
Se concentrer sur un objet ? : Cadastre napoléonien ? Verniquet ? Cassini ?
# B- Programme Journée 2 :
## Programme Définitif établi le 27 sept.
Titre : **Res(t)ituer les adresses des almanachs et annuaires commerciaux parisiens du XIXe siècle. Un corpus de localisations urbaines à grande échelle.**
Lieu : Salle 70 BnF François Mitterrand.
Date : 10 novembre 2022, 9h30, accueil à partir de 9h.
Déjeuner au belvédère de la BnF
| Timeline | Durée | |
| -------- | ------ | ------- |
| 09:30 | 10 min | Ouverture |
| | | **Partie 1 : Les collections d'annuaires commerciaux parisiens. Corpus, extraction, exploitation par l'équipe SoDUCo-BnF**|
| 09:40 | 20 min | Inventaire critique du corpus des collections d’ouvrages proposant des listes d’adresses parisiennes au XIXe siècle. *Pascal Cristofoli, Viera Rebolledo-Dhuin* |
| 10:00 | 20 min | Extraction automatique d'informations dans les annuaires commerciaux parisiens. *Nathalie Abadie, Edwin Carlinet, Joseph Chazalon, Bertrand Duménieu.* |
| 10:20 | 20 min | Questions et pause |
| 10:40 | 20 min | Localisation, adresses et numérotations parisiennes. *Stéphane Baciocchi, Bertrand Duménieu et Julien Perret* |
| 11:00 | 20 min | Exploitation des données SoDUCo : premiers éléments de l’évolution des activités parisiennes au fil du siècle. *Julie Gravier, Marc Barthelemy* |
| 11:20 | 20 min | La production et commercialisation des cartes et son annonce dans les annuaires du commerce au XIXe siècle. *Eve Netchine (BnF)* |
| 11:40 | 15 min | Questions |
| 11:55 | | Pause repas |
| | | **Partie 2 : Exploitations de sources similaires par d’autres équipes** |
| 14:00 | 20mins | « Spatialités sociales à Paris à la veille de la Révolution. Les apports d’un système d’information géographique » *Mathieu Maraud*, *Anne Varet-Vitu* et *Eric Mermet* |
| 14:20 | 20mins | « Annuaire des propriétaires et des propriétés de Paris (1898, 1903, 1913, 1923) : du papier à la carte » *Carmen Brando* (CRH/PSIG EHESS), *Frédérique Mélanie* (Lattice UMR8094 CNRS-ENS). |
| 14:40 | 25 min | Questions et pause |
| 15:05 | 20mins | «Traitement et analyse des débats parlementaires à la Chambre des députés (1881-1899) : problèmes, défis et solutions», *Aurélien Pellet* et *Marie Puren* (laboratoire MNSHS, Epitech Paris). |
| 15:25 | 20mins | Les almanachs, un outil de localisation, d'attribution et de datation des activités commerciales représentées dans le corpus iconographique retraçant l’histoire du quartier Richelieu, *Charlotte Duvette & Justine Gain*, Département des études et de la recherche - INHA. |
| 15:45 | 25mins | Questions et pause |
| | | **Partie 3 : Travail collaboratif sur des cas particuliers à partir des données Soduco** |
| 16:10 | 40 min | 4 présentations flash de 10 minutes |
| | | 1. Quelques éléments de discussion sur le recensement des libraires et imprimeurs dans les Almanachs du commerce *Viera Rebolledo-Dhuin (Université Paris-Est-Créteil)* |
| | | 2. Une approche pour la création d'un graphe spatio-temporel à partir des données extraites des annuaires: application aux photographes. *Solenn Tual (LASTIG, Univ Gustave Eiffel, IGN-ENSG)*|
| | | 3. A propos de quelques de *Médecins, chirurgiens et officiers de santé* en 1845 *Pascal Cristofoli (CRH-EHESS)* |
| | | 4. La fabrique collective de gants grenobloise à Paris. *Stéphane Baciocchi (CRH-EHESS) et Audrey Colonel-Coquet* |
| 16:50 | ... | discussion & questions |
| 17:30 | | Clotûre |
## 1- Objet et organisation :
Lieu : Salle 70 BnF François Mitterrand.
Date : 10 novembre 2022
Réservation du Belvédère pour le déjeuner.
Argumentaire de la journée :
*Phénomène éditorial des annuaires (augmentation et diffusion avec le développement des villes, avec diffusion de l'imprimé et les innovations éditoriales). Mais aussi et surtout annuaire = un objet spatial : ensemble d'informations à référence spatiale indirectes.
Questions transversales pour la journée : complétude/incomplétude & mesure de la qualité*
Titre proposé : **Res(t)ituer les adresses des almanachs et annuaires commerciaux parisiens du XIXe siècle. Un corpus de localisations urbaines à grande échelle.**
[Lien vers affiche et texte de présentation](https://sharedocs.huma-num.fr/wl/?id=VpjdX9cxsuvojxsUdxjucbecWoi1UMOV&fmode=download)
**Equipe organisatrice mobilisée (17) :**
BNF : P. Chevallier, J.-D. Mellot, E. Netchine, C Ion, A. Agniesa / SoDUCo et associés : J. Perret, N. Abadie, S. Tual, Melvin Hersent, Charly Bernard (IGN), E. Carlinet, J. Chazalon (EPITA), M. Barthelemy, J. Gravier, P. Cristofoli, S. Baciocchi, B. Dumenieu, V. Rebolledo-Dhuin (UPEC).
**Invités (11) :** C. Duvette, J. Gain, M. Maraud, E. Mermet, F. Melanie, C. Brando, M. Puren, A. Pellet ; A. Colonel-Coquet, J.-L. Pinol ; **invités avec présence pas sûre :** : L. Jeanson, Nicolas Le Bourgeois, A. Varet-Vitu (non présente).
**invités potentiels SoDUCo avec présence pas sûre** Yann Meneroux, Mathieu Fernandez, Juste Raimbault, Valentine Weiss, Simona Cerutti, Stéphane Gomis, Raphael Morera, Dinah Ribard
**Invités potentiels BnF :** ?
## 2- Programme résumé
Accueil : 9h
Début : 9h30
**MATIN**
1] Inventaire d’un corpus et histoire critique des collections d’ouvrages
9h30 - 10h : Présentation du corpus
10h - 10h30 : Extraction automatique d'informations
Quelques métriques et les ordres de grandeur.
PAUSE 15 minutes
2] Adressage, localisation et analyse
10h45 - 11h15 : Geocodage historique et la question de la numérotation (du changement de numérotation)
11h15 - 11h45 : Exploitation des données Soduco
TAMPON RETARD 15 mins
TOTAL = 2h30
**APRES-MIDI**
3] : Travail collaboratif sur des cas particuliers à partir des données Soduco
14h - 14h40 : 8 présentations flash de 5 minutes = 40 minutes
14h40 - 15h : discussion & questions
PAUSE : 15 mins
4] l’exploitation de sources similaires par d’autres équipes
15h15 - 15h45 : Almanach 1789
15h45 - 16h15 : Annuaire des propriétaires 1900
PAUSE 15 mins
16h30 - 17h : Débats parlementaires 3e république
17h - 17h30 : Histoire du quartier Richelieu
TAMPON RETARD : 15 mins
TOTAL = 3h45
**Légende** :
:+1: Accord participation / :+1::+1: Accord et titre ok
## Matinée : 9h30-12h00 : Présentation du travail SoDUCo
Présidence : à voir, par exemple N. Coquery (?), Carmen ??
### 1/ L'exploitation d’un corpus d'ouvrages
#### 1.1/ 9h30 - 10h00 : Inventaire critique du corpus des collections d'ouvrages proposant des listes d'adresses parisiennes au XIXe siècle.
Présentation du corpus & histoire critique des collections d’ouvrages. Pascal, avec la coll. avec Stéphane, Viera Rebolledo-Dhuin, J.-D. Mellot: sur la constitution des annuaires, ... **=>** *J.-D. ne pourra finalement pas participer à la présentation, mais il sera présent le matin du 10*
- Introduction à la journée.
- cf. texte de présentation de la journée
- Premiers résultats du travail Soduco
- référence à la source, traçabilité
- outils libres
- données libres
- Programme de la journée
- restituer
- resituer
- évaluer
- Mise en abyme : Construire un outil pour décrire Paris au XIXe / Construire des outils pour restituer le Paris du XIXe siècle
- Le corpus des annuaires: inventaire critique
- Desription générale
- Des collections de long terme et des moments de concurences éditoriales
- Des logiques combinées : clients et fournisseurs ; souscripteurs / public ; Qui y est, qui n'y est pas ?
- Le corpus numérique actuel (et propositions de numérisation)
- Un corpus de listes d'adresses
- Différents types de listes
- Le contenu des listes et leur périmètre
- Les autres informations contenues dans les annuaires
- Quelques pistes concernant la production concrète (composition, mise à jour ...)
- Conclusion: une première sélection d'ouvrages et de listes :
- Tableau des annuaires-listes sélectionnés (nombre de pages)
- Wiki - Outils libres - Opendata
- Soduco : *objectif général étudier les dynamiques sociales en contexte urbain, mais premiers travaux et résultats : retour critique sur la composition des annuaires et sur l'évolution des informations qu'ils contiennent.
**Invitation d'un typographe pour expliquer comment sont composés et imprimés les annuaires (Christian Laucou : http://clstypo.fornax.fr/)**
**=>** **info de J.-D. Mellot, sept 20022** :
*Christian Laucou serait d'accord pour faire une présentation sur le fonctionnement des ateliers typographiques appliqué à la question des nouvelles éditions et en particulier aux annuaires. A priori, son intervention pourrait durer environ 2 heures, avec présentation d'outils et d'exemples. Une petite salle, de ce fait, serait plus indiquée qu'un amphi, me dit Christian, afin de faire passer les objets. Il propose une rémunération de 500 euros net ; j'espère que cela est budgétisable sans pbm.*
**=>** **Pascal va contacter C. Laucou** pour voir de quelle manière il pourrait participer dans le timing contraint de la journée, quitte à organiser un atelier plus tard.
#### 1.2 / 10h - 10h30 : Extraction des informations et reconnaissance des entités nommées. Qu'est-ce que les outils d'extraction nous apprennent de la composition des annuaires?
Extraction automatique d'informations dans les annuaires et analyse critique de leur structure (structure des documents, OCR, entités nommées ... ):
Joseph + Edwin + Bertrand + Nathalie
**PAUSE 15 minutes**
#### 1.3/ 10h45 - 11h15 : Geocodage historique et la question de la numérotation
Bertrand + Julien
Présenter la chaine de traitement + évaluer l'intersection des adresses des plans et de celles des annuaires + comparer les numérotations de Jacoubet et Vasserot
--> livraison d'un jeu de données avec les adresses de Paris extraites des annuaires et fusionné avec les adresses extraites des plans.
#### 1.4/ 11h15 - 11h45 : Exploitation des données Soduco: Marc & Julie (30 mn MAX)
Point sur la qualité des données, exploitations: envisager plutôt un ou deux exemples méthodes/résultats sympas sur Paris au 19e s.
## Après-midi :
Présidence:
### 2 - ATELIERS & Etude de cas - 14h00 -14h40 :
#### - 14h00 -14h40 : Travail collaboratif sur des cas particuliers à partir des données Soduco
*8 présentations flash de 5 minutes = 40 minutes* (à voir en fonction de ce que l'on conserve)
##### 2.1 : Eve Netchine (BNF) : la production et commercialisation des cartes et son annonce dans les annuaires du commerce au XIXe siècle.
**=>** Eve Netchine, 24/08/22 : *Présentation prévue: la production et commercialisation des cartes et son annonce dans les annuaires du commerce au XIXe siècle. A priori, la question des catalogues de libraires et notamment du catalogue de 1815 de l'almanach du commerce sera inclue dans la partie introductive de la communication, comme un élément de la problématique générale sur l'usage des sources.*
##### 2.2 : Gantiers (Stéphane) ;
##### 2.3 : Libraires-Imprimeurs (Viera) ;
- Rappels sur la législation régissant les libraires-imprimeurs
- Précisions sur la géographie des libraires-imprimeurs : les espaces des libraires parisiens
- Comparaison extractions avec les chiffres observés dans la thèse/ouvrage
- Comparaison avec l'extraction
##### 2.4 : Photographes (Nathalie, Solenn Tual)
+ données d'une chercheur des archives nationales / EHESS: Marie Eve Bouillon (à inviter ?) : http://cehta.ehess.fr/index.php?859)
- Interface de visu à discuter le 27 : https://solenn-tl.github.io/stage_demo_photographes/ ;
##### 2.5 : Médecins (Pascal) ;
*Comparaison du contenu de plusieurs “listes” produites en 1845 concernant les médecins, officiers de santé, chirurgiens de paris et du département de la Seine. L’exercice de ces professions est soumis à l’autorisation des pouvoirs publics (liste officielle est produite en décembre 1843). Il y a plusieurs statuts en fonction des diplômes et des dates d’entrée dans la carrière médicale. Contexte des années 1840 : crise du corps médical (surpopulation médicale), dénonciation des charlatans, de la publicité. Organisation à l’iniative d’un groupe de médecins du 1er congrés médical de Paris en novembre 1845, qui fut un succés en terme de participation.
But: étudier la mise à jour des informations dans les annuaires et le lien avec les sources administratives, la discorance éventuelle de présence des informations dans les listes alphabétiques et professionnelles, les choix éditoriaux de présentation (mélange des médecins et officiers de santé), l’étude des argumentaires des publicités dans les listes professionnelles…*
##### 2.6 : Marchands de Tableaux (Julie);
##### 2.7 : Autres idées
- erreurs dans les annuaires
- Présentation jeu de donnée V1.1
#### - 14h40-15h00 : discussion & questions
**PAUSE : 15 mins**
### 3/ 15h15-17h30 : L'exploitation de sources similaires par d'autres équipes (interventions de 35 mn)
#### 3.1/ 15h15-15h45 : :+1: Almanach 1789 : Mathieu Maraud, Anne Varet-Vitu et Eric Mermet
**=>** Réponse Mathieu Maraud, 12/09/22 :
*Je crois qu'on peut remercier Pascal de nous convier à ce projet. Très heureux pour ma part d'y participer.
Peut-être pourrions-nous saisir cette opportunité, ou décider d'un autre moment, pour discuter avec Pascal, Stéphane et Bertrand, de la pérennité de l'adressage parisien de 1789. Comment conserver ce travail et assurer sa mise en ligne, sa consultation, en dépit du départ prochain d'Eric? J'espère que nous trouverons une solution pour que ce projet CRH-plateforme SIG connaisse l'achèvement que nous avions conçu pour lui.*
#### 3.2/ 15h45 - 16h15 : :+1::+1: « Annuaire des propriétaires et des propriétés de Paris (1898, 1903, 1913, 1923) : du papier à la carte » Carmen Brando (CRH/PSIG EHESS), Frédérique Mélanie (Lattice UMR8094 CNRS-ENS),
Eric Mermet et J.-L. Pinol (Paris Time-Machine)
**=>** Réponse Carmen Brando, 14/09/22 : *Merci pour cette invitation, J'avais bien noté la date lors de notre dernier échange, je serai ravie de participer à votre séminaire et de présenter avec Frédérique le travail sur les annuaires de propriétaires.*
**PAUSE 15 mins**
#### 3.3/ 16h30 - 17h00 : :+1::+1: «Traitement et analyse des débats parlementaires à la Chambre des députés (1881-1899) : problèmes, défis et solutions», Aurélien Pellet et Marie Puren (laboratoire MNSHS, Epitech Paris).
Débats parlementaires 3e république (Projet AGODA, Marie Puren, Nicolas Le Bourgeois, Aurélien Pellet, EPITECH)
**=>** Réponse Marie Puren, 15/09/2022 : *Ce sera avec plaisir que j’interviendrai lors de cette journée du 10 novembre. Je mets également mon collègue Aurélien Pellet en copie, car il est très investi dans le projet.*
*En ce qui concerne la présentation lors des ateliers, nous pourrions par exemple axer la présentation autour des points suivants : présenter le projet et ses finalités – en mettant en avant en quoi les débats ressemblent aux annuaires ? -, expliquer comment nous avons mobilisé l’outil développé par Joseph et Edwin, enfin exposer les problèmes que nous rencontrons encore et les solutions envisagées. Nous avons également mené des analyses sur ce corpus (plutôt TAL) que nous pourrions présenter. Est-ce que cela conviendrait ?*
#### 3.4/ 17h00-17h30 : :+1: Histoire du quartier Richelieu, Charlotte Duvette & Justine Gain, Département des études et de la recherche - INHA ;
Pas sûr: Loic Jeanson, INHA.
*Le projet Richelieu est actuellement centré sur le traitement des corpus iconographiques et cartographiques, depuis le travail de nettoyage des données entrepris par un étudiant de l'EPFL l'année précédente, nous nous focalisons sur l'usage de ces données comme outil de localisation, d'attribution et de datation des activités commerciales représentées dans notre corpus icono.Cela dit, si ce sujet vous semble à propos pour la journée, je vous en parlerai avec plaisir.*
*Mon collègue spécialiste des humanités numériques (Loïc Jeanson) est actuellement en poste à Lausanne, je ne suis pas certaine qu'il puisse se joindre à nous pour cet évènement (je le laisse vous répondre à ce sujet), mais une collègue historienne actuellement en charge du traitement d'un fond icono touchant au Palais-Royal (en copie de ce mail) pourra peut-être se joindre à moi pour évoquer le sujet de l'usage des annuaires par les historiens d'art.*
**TAMPON RETARD : 15 mins**
TOTAL = 3h45
#### 17h30-17h45 : Clôture de la journée ;
# Organisation concrète de la journée :
# Réunions passées :
- 20220411 : 1ère journée SoDUCo-BNF
- 20220413 : Débriefing 1ère journée et réflexion sur la séance 2/4.
- 20220509 : Réunion préparation 2nde journée
- 20220610 : Réunion à la BNF sur le corpus de annuaires
- 20220620 : Réunion préparation 2nde journée
- 20220708 : Point à l'EPITA
- 20220915 : Visio point d'étape de la préparation de la 2nde journée
- 20220927 : Réunion préparation de la 2nde journée
**Documents liés au groupe Soduco-annuaires :**
[2022/07/08 - Réunion EPITA](https://hackmd.io/siWqN7unRTWWdaRn2uS2Cw)
[2022/06/20-Réunion Soduco-Bnf](https://hackmd.io/lYJydh7yQ5umzEvvo0VYaw) ;
Inventaire des annuaires, Bilan au 20 juin: [Inventaire](https://fr.overleaf.com/project/613b56dfa0a5df70c42d28ee) et [Tableau synthétique](https://fr.overleaf.com/project/615d87b65fba99f4badc6cc4) ;
[20220509 - Reunion prépa Journée 2 Soduco-BnF sur les annuaires](https://hackmd.io/BBjXFQfIQoO2MwHvXqj1dw) / [20201001-Atelier Annuaire](https://hackmd.io/SOfDrnGPRR61E9bob9afKQ) / [20190208-Réunion Annuaires](https://hackmd.io/DmgqqQVrQuiRipSBbaO95w)
# Prochaines étapes :
## Présidence de la journée
Claire Lemercier indisponible :-1:
**=>** Réponse C. Lemercier : *Je n'avais pas eu vent du projet et je suis vraiment ravie de son existence, c'est quelque chose qui aura sûrement une utilité très large. Malheureusement, le 10 novembre nous avons "atelier quanti" Claire Zalc. **En revanche, très volontiers pour discuter avec une partie de l'équipe une autre fois (en 2023 ?) si cela peut s'organiser, je te laisserai juge de qui serait particulièrement intéressé.e par mes commentaires ?** Du coup, Claire Zalc, qui aurait été très intéressée également, ne sera pas dispo non plus ; peut-être Anaïs Albert ? (sur l'objet + en vertu de ce qu'elle a appris sur les collaborations/numérisations dans l'ANR de Manuela Martini)*
Autres propositions :
B. Gauthiez : [The production of Urban Space, Temporality, and Spatiality, 2022](https://www.degruyter.com/document/doi/10.1515/9783110623062/html)
N. Coquery (annuaires XVIIIe) ; T. Leroux ;
Alain Blum (Démographe), France Guérin
Economistes : G. Postel-Vinay, P.-C. Hautcoeur ?
Eric Guichard ? (Lyon)
**=>** **Pascal va faire le point**
## Organisation concrète de la journée
### Public :
- Invitations spécifique :
**=>** **préparation d'un fichier partagé**
- Journée ouverte au public, pas de limites, si ce n'est la taille de la salle.
- Organisation d'une visio (la salle est équipée)
- Questions pratiques pour la salle 70 :
Prévoir des mutliprises pour brancher les ordis?
Accès réseau : wifi bnf / Eduroam : ok
**=>** Vérification par Philippe
**=>** **Question : inciter à l'inscription même si c'est ouvert ?**
### Repas et Pot :
- Repas: (intervenants et équipe organisatrice) -> lancement de la demande de devis une fois la liste stabilisée
- Pot fin d'après midi : 50 personnes ? (Réserver l'espace spécifique à coté de la salle 70)
**=>** **Philippe & Pascal s'en chargent.**
### Publicité:
**=>** **A faire**
- Affiche CRH -> contacter Hugo.
- Pleupler le Site Soduco : https://soduco.github.io/
- Listes de diffusions:
AFHE?, H2C?, Athena?
## Travaux préparatoires à la journée
### Besoins d'extraction de données ?
A partir de mots-clefs, Julie peut extraire un corpus spécifique d'entrées au sein de l'emble des extractions réalisées en juin dernier.
**Par exemple, pour Eve, on pourrait imaginer extraire les entrées contenant la chaine de caractères "carto"**
**Viera : je serais intéressée par les chaînes "libr" et "impr"**
### Jeu de données SoDUCo V01.01 du 10/11/2022
Objectif 10 novembre : disposer d'un jeu de données utilisable au format Json avec un outil simple de visualisation et de recherche et les exports qui vont bien.
Cela fait office de livrable pour l’ANR. L’idée est de pouvoir “montrer” simplment le résultat du travail et de créditer le travail réalisé.
Publication du jeu de donnée en JSON.
#### Préparation du jeu de données (Json): peuplement des JSon avec des informations supplémentaires
Périmètre : listes alphabétiques
Base JSON actuels (20/06/2022):
Mises à jour successives issus de plusieurs traitements (sur le ftp ign):
- géocodage (Bertrand).
- intégration des métadonnées des listes (Julie)
- intégration de métadonnées calculées permettant de juger de la qualité des entrées (Julie)
- intégration de métadonnées liées au traitement des images (Edwin & Joseph).
#### Une interface simple de visualisation:
- Interface de visu des pages annuaires
- Interface de visu-interrogation-extraction des pages annuaire (voir travail de Solenn)
- Par page
– Affichage image originale
– Affichage données extraites et traitées (NLP, Geocodage)
– Visualisation cartographique
– export CSV/TEI
- Par des recherche simple
– par nom
– par profession
– par rue
# Programme de la réunion 27 septembre (matin)
Réunion à l'EHESS :
- Titres des interventions
- Grandes lignes des présentations
------------------------------------------------
# Projet initial Journée 2 :
1: Inventaire d’un corpus et histoire critique des collections d’ouvrages
- Corpus
- Premières quantifications des informations
- Le genre *annuaire* et ses influences
2: Usage des annuaires dans les travaux historiques (1/2 journée EHESS-CRH)
- Travaux soduco
- Travaux d'autres équipes (EPFL ? Carré Richelieu ? autres ?)
3: L'Exploitation en masse des annuaires
- Extraction (structure des documents, OCR, entités nommées)
- Geocodage historique
- Exploitation (travaux Julie/Marc, etc.)
4: Ateliers de mise en pratique ?
## 1 - Inventaire d'un corpus et histoire critique de collections d'ouvrages
### 1.1 - Le corpus des annuaires : description
- Le corpus des annuaires et l'histoire d'un genre éditorial (S. Baciocchi, V. Rebolledo-Dhuin, P. Cristofoli)
Inventaire des ouvrages, contextualisation dans l'évolution générale de l'industrie du livre.
> V. Rebolledo-Dhuin, « La librairie et le crédit. Réseaux et métiers du livre à Paris (1830-1870) », 2011. https://tel.archives-ouvertes.fr/tel-00768969
- L'origine des annuaires au XVIIIe.
> N. Coquery, « La boutique à Paris au XVIIIe siècle », Habilitation à diriger des recherches, Université Paris I Panthéon Sorbonne, 2006. Consulté le: 4 février 2022. [En ligne]. Disponible sur: https://halshs.archives-ouvertes.fr/tel-01981174
- Les hommes des annuaires : prosopographie des entreprises, auteurs et rédacteurs d'annuaires, imprimeurs
> - S. Bottin : Oliveira M., 2003. Ma notice biographique jusqu’à mon arrivée à Paris, par Sébastien Bottin, Revue du Nord, 349, p. 163‑182
> - Didot, Charles Lamy, J. De la Tynna, C. Cambon, C. Malo, ...
> - imprimeurs Valade,
- Public visé, et guerres éditoriales, publicité, concurence
#### Le corpus des annuaires dans les fonds d'archives
### 1.2 - Les annuaires : première qualification et quantification des informations contenues.
- Inventaire des listes, des informations. Typologie d'annuaires.
- Les sources: Les listes originales : listes fiscales, électorales, notables commerçans
- Les premiers temps : 1780-1815 ?
-- Numérotation (passage Krenfeld - numéros révolutionnaires - numérotation 1805
-- comparaison Cartes de Sureté
- Etudes de cas : AlmComm1801 / Didot1851
-- Paris-Province
-- Un outil de diffusion des lois et règlements
-- Production et diffusion des marchandises
-- Figurer dans l'annuaire, une "raison sociale"
### 1.3 - Le genre annuaire
#### 1.3.1 - Les annuaires & l'innovation
- Innovations éditoriales
Types d'information, format, publicité...
- Innovations d'imprimerie : Typographie didot
Quelqu'un du CNAM ?
Eric Guichard ?
- Les brevets d'invention et les expositions de l'industrie comme matrice.
-- Juste Raimbault
-- Steeve Gallizia (INPI) et Connection avec Base brevet.
#### 1.3.2 - Les influences multiples du genre annuaires
- la statistique publique :
-- Bottin, La Tynna et F. De Neufchateau
> L. Bergeron, Banquiers, négociants et manufacturiers parisiens du Directoire à l’Empire. Paris: Éditions de l’École des hautes études en sciences sociales, 2013.
> J.-C. Perrot, L’âge d’or de la statistique régionale française: an IV-1804. Société des études robespierristes, 1977.
- La fabrique parisienne :
> M. Gribaudi, Paris ville ouvrière: une histoire occultée (1789-1848). Paris, France: La Découverte, impr. 2014, 2014.
-- Les secteurs industriels / Annuaires spécialisés
- Le commerce
> C. Lemercier, Un si discret pouvoir: aux origines de la Chambre de commerce de Paris : 1803-1853. Paris: La Découverte, 2003.
> L. Marco, « Le renouveau du marché des livres de commerce à Paris en 1802 », Philosophia Scientiae, vol. 22‑1, nᵒ 1, p. 43‑61, 2018.
- L'industrie
-- Société d'encouragement de l'industrie nationale
-- (Thomas Le Roux) - les établissements insalubres / les vaches à Paris / Les carrières de Belleville
-- Saint-Simonisme
-- Classement des professions
(tables des matières / + classement Didot1843a)
-- Etudes de cas : gantiers, médecins / pharmaciens
> C. Lemercier, « Classer l’industrie parisienne au xixe siècle », p. 32.
- L'annuaire administratif et judiciaire.
- Les Notabilités parisiennes et Paris Mondain
> C. Grange, Les gens du Bottin Mondain 1903-1987: y être, c’est en être. Paris: Fayard, 1996.
- Paris et le reste de la France:
-- les adresses des villes de province dans les annuaires:
-- Les annuaires patriculiers des régions Française
-- Table géographique des Didot
## 2 - Usage des annuaires dans les travaux historiques
Journée EHESS - CRH associé ?
But: mobiliser les historiens qui ont travaillé sur ces sujets. Croisement annuaires et autres sources.
- Cas gantiers et médecins ?
- Groupe St-Jean De Latran? Isabelle Holstein, Carole Aubé, Alex Frondizi, Laurent ...
- Almanach 1789 : Mathieu & Anne et Eric ?
- Carmen & Eric, annuaire des propriétaires => Paris Time-Machine
- Historiens qui ont travaillé à l'aide des annuaires ?
- Possibilité de travail sur d'autres villes :
-- Groupe Lyon ? Grenoble, ...
> Bernard Gauthiez (*The production of Urban Space, Temporality, and Spatiality: Lyons, 1500-1900* (2020))
## 3 - L'Exploitation en masse des annuaires
### 3.1 - L'Exploitation en masse des annuaires : outils et données
- Soduco
-- présentation-démonstration de l'annotator
-- Extraction et Annotation (Article DAS)
-- Premières exploitation (Julie & Marc)
### 3.2 - Le Géocodage des adresses parisiennes anciennes : procédures et méthodes
- le problème des numérotations parisiennes
- Géocodeur historique (Bertrand)
- E. Mermet et Anne : Numérotation Royale et adressage élastique
- D. Wacquet : Numérotation révolutionnaire.
- Numérotation à la porte ?
### Invités ? :
-- EPFL-Richelieu
-- New-York - city directories : https://www.ncbi.nlm.nih.gov/pmc/articles/PMC7437912/ (et là, aussi: http://spacetime.nypl.org/city-directory-meetup/#/).
## 4 - Atelier de mise en pratique ?
### Atelier d'annotation/correction :
- Imprimeurs, libraires et gens du livre dans les annuaires : liens avec Databnf et gallica ?
- Ouverture vers la science participative : correction collective - Geneanet ?
- Appariement d'entrées d'annuaires (Stage IGN)
### Atelier visualisation ?
Premières expérimentations de cartographie et de visualisations :
- Visualisation des adresses dans les plans d'époque ? Style de cartes verctorielles
- Visualisations de populations et de thématiques.
- Représenter des trajectoires spatiales ?
- Visualisations originales alternatives ? Sidonie (IGN), Equipe Aviz, Fekete ?
# Groupe de travail “activités” et préparation de la 2nde journée BnF "Annuaires"
Pascal coordonne
Julie+Emilie+Stéphane+Joseph+Nathalie+Bertrand+Nathalie+etc.
# Réunion de préparation :
## Point sur le travail
- Etat application "Annotator" / NLP
- Etat procédure de géocodage. Qualité.
- Agenda production nouvelles données.
- Question Nathalie sur approches d'extraction d'entités nommées multiniveaux
## Organisation de la partie Exploitation & Etudes de cas
- Exposé des cas
- Circuit des données
-
### Point sur les données en sortie
### Evaluation du contenu des annuaires via l'extraction de données Soduco
Quels indicateurs ?
Nbre d'entrées, nombre d'entrées redondantes (d'une année sur l'autre) ?
#### Penser un plan d’échantillonage à l’échelle de l’ensemble des annuaires
Combien de professions dans chaque annuaire
résultats attendus pour septembre
## Evaluation des résultats de la procédure Soduco
### Comparaison avec études existantes:
#### Travaux PTM - I. de Léonardo
#### Le marché de l'art parisien (1815-1954) (Julie)
Base de données relative aux marchands de tableaux à partir des Annuaires. J'ai surtout remarqué qu'ils ont plus tardivement (en 2017) fait un webSIG de ces données, que l'on peut récupérer facilement car ils chargent directement un geoJSON -- intitulé galeries_1815_1955 -- dans leur application.
Les références :
> de Maupeou, F. and Saint-Raymond, L. (2013) ‘Les “marchands de tableaux” dans le Bottin du commerce : une approche globale du marché de l’art à Paris entre 1815 et 1955’, Artl@s Bulletin, 2(2), p. Article 7.
> Saint-raymond, L., Maupeou, F. De and Cavero, J. (2015) ‘Les rues des tableaux. Géographie du marché de l’art parisien (1815-1955)’, Artl@s Bulletin, 4(1), p. Article 6.
WebSIG : http://paris-art-market.huma-num.fr/
*Globalement, sur les années que j'avais pour l'instant sélectionnées (à savoir 1839, 1845, 1855, 1864, 1875, 1885, 1893 et 1904) et en essayant de tenir compte de la multiplicité des dénominations dont ils parlent dans leurs articles pour désigner les marchands de tableaux ("experts en tableaux", etc.), j'ai 375 occurrences de marchands bien géolocalisés (i.e. à l'adresse avec un gazetteer score >= 0.9), tandis qu'ils en ont 648. J'aimerais bien mener une comparaison systématique qualitative entre les données SoDUCo et celles de ce projet pour évaluer quelles sont les différences ou, au contraire, les identifications identiques afin de mieux "évaluer" -- au sens large -- les données SoDUCo. Dans cette perspective, je considérerai bien entendu toutes les entrées de ces dates là et non uniquement celles qui sont géocodées. Qu'en pensez-vous ?*
## Annuaires et plans
### Annuaires et Verniquet
Favre_1798
Almcomm_1801
Almcomm_1805
alm_com_1807 ???
Duverneuil_et_la_tynna_1805 : Liste alphabétique des rues, places, culs-de-sacs, cours, passages, boulevards, portes, quais, ports, ponts, etc. de Paris (2 colonnes), vues 434-454.
# Réunion du 27/09/2022 - notes
Présents : Pascal Cristofoli, Solenn Thual, Joseph Chazalon, Stéphane Baciocchi, Julien Perret, Julie Gravier, Nathalie Abadie, Edwin Carlinet, Bertrand Dumenieu, Philippe Chevallier (online), Charly Bernard (online), Melvin Hersent (online).
Affiche grand-format de la journée commandée au service communication du CRH :
- changer police par Didot
- supprimer les glyphes en haut de l'affiche
- manque le logo IGN
- ajouter un petit texte de présentation ?
Discussion sur les localisations parisiennes :
Stéphane :
- la numérotation des villes suit l'extension et la régularisation des trames urbaines. Les annuaires décrivent cette extension.
- Stéphane souhaite avoir pour chaque date de grand plan de Paris l'ensemble des entrées d'annuaires loaclisées
- saisie du livre de compte (clients) d'un important gantier grenoblois. Ses clients sont en partie à Paris; on voit que les clients sont des marchants de mode et de nouveautés. Les annuaires décrivent aussi les articulations entre les professions parisiennes et les départements.
- annuaires : ouvrage à l'échelle de la France.
Bertrand :
- présentation matin sur le géocodage à étendre à la question des localisations parisiennes
- typologie des erreurs de géocodage et complexités du numérotage/localisations parisiennes
Nathalie :
- deux erreurs typiques sur le géocodage : les localisations ambigües (rue d'Anjou) et le bruit OCR.
Discussion sur la trame de la mâtinée :
Joseph :
- 2 messages à faire passer sur l'analsye de données : démarche scientifiques, spécificités du traitement de données en masse
Stéphane :
- des mesures spécifiques pour un corpus de données fines, en masse ?
- faire apparaître les ordres de grandeur des annuaires
- tracer l'évolution du nombre d'entrées dans les annuaires (cf. travail de Julie)
:warning: biais d'échantillonage, validité des conclusions d'analyse et qualité de la description fournie et permises par les annuaires et les traitements.
Stéphane :
- Il n'y a pas une seule façon de mesurer les erreurs, trouver les bonnes métriques ayant du sens est un sujet.
Julie:
- discuter de la typologie des activités à partir des annuaires
- évolution de ces groupes au fil du temps
Pascal : quelques mots-clefs relevés dans la discussion:
- ordres de grandeur, mesures spécifique par échelle
- Question de la significativité : montre que l'invers n'est pas vrai.
- les marges de Paris (mot clef: villages ?)
- Montrer que les données peuvent être erronées à différents stades. Mais dire aussi que ce qu'on fait est dans l'état de l'art
## PROGRAMME DEFINITIF
**10 novembre 2022, 9h30 (accueil à partir de 9h)**
| Timeline | Durée | |
| -------- | ------ | ------- |
| 09:30 | 10 min | Ouverture |
| | | **Partie 1** : Les collections d'annuaires commerciaux parisiens. Corpus, extraction, exploitation par l'équipe SoDUCo-BnF|
| 09:40 | 20 min | Inventaire critique du corpus des collections d’ouvrages proposant des listes d’adresses parisiennes au XIXe siècle. *Pascal Cristofoli, Viera Rebolledo-Dhuin* |
| 10:00 | 20 min | Extraction automatique d'informations dans les annuaires commerciaux parisiens. *Nathalie Abadie, Edwin Carlinet, Joseph Chazalon, Bertrand Duménieu.* |
| 10:20 | 20 min | Questions et pause |
| 10:40 | 20 min | Localisation, adresses et numérotations parisiennes. *Stéphane Baciocchi, Bertrand Duménieu et Julien Perret* |
| 11:00 | 20 min | Exploitation des données Soduco : premiers éléments de l’évolution des activités parisiennes au fil du siècle. *Julie Gravier, Marc Barthelemy* |
| 11:20 | 20 min | La production et commercialisation des cartes et son annonce dans les annuaires du commerce au XIXe siècle. *Eve Netchine (BnF)* |
| 11:40 | 15 min | Questions |
| 11:55 | | Pause repas |
| | | **Partie 2** : L’exploitation de sources similaires par d’autres équipes |
| 14:00 | 20mins | Almanach 1789 : Mathieu Maraud, *Anne Varet-Vitu* et *Eric Mermet* |
| 14:20 | 20mins | « Annuaire des propriétaires et des propriétés de Paris (1898, 1903, 1913, 1923) : du papier à la carte » *Carmen Brando* (CRH/PSIG EHESS), *Frédérique Mélanie* (Lattice UMR8094 CNRS-ENS). |
| 14:40 | 25 min | Questions et pause |
| 15:05 | 20mins | «Traitement et analyse des débats parlementaires à la Chambre des députés (1881-1899) : problèmes, défis et solutions», *Aurélien Pellet* et *Marie Puren* (laboratoire MNSHS, Epitech Paris). |
| 15:25 | 20mins | Histoire du quartier Richelieu, *Charlotte Duvette & Justine Gain*, Département des études et de la recherche - INHA. |
| 15:45 | 25mins | Questions et pause |
| | | **Partie 3** : Travail collaboratif sur des cas particuliers à partir des données Soduco |
| 16:10 | 40 min | 4 présentations flash de 10 minutes |
| | | 1. Libraires-Imprimeurs *(Viera)* |
| | | 2. Une approche pour la création d'un graphe spatio-temporel à partir des données extraites des annuaires: application aux photographes. *Solenn Tual (LASTIG)*|
| | | 3. Quelques listes de *Médecins, chirurgiens et officiers de santé* en 1845 *Pascal Cristofoli (CRH-EHESS)* |
| | | 4. La fabrique collective de gants grenobloise à Paris. *S. Baciocchi (CRH-EHESS) et Audrey Colonel-Coquet* |
| 16:50 | ... | discussion & questions |
| 17:30 | | FIN |
## Organisation**
Café + pot en fin de journée. P. Chevallier réserve le café qui sera disponible dans le couloir.
Visio : salle Zoom à créer par nous ou la BnF, partage d'écran depuis le PC BnF de la salle. Les présentations devront être disponibles sur le PC.
**Récupérer les présentations en avance : au plus tard le matin du séminaire **
**Demander aux intervenants s'ils acceptent que leurs présentations soient (1) partagées avec les participants ou (2) diffusées sur le site du projet.**
**Wifi** : disponible, réseau BnF.
**Electricité** : quelques multiprises disponibles.
**Evento pour s'inscrire sur site ou visio, 70 places disponibles sur place. **
Salle 70 = juste à coté du petit auditorium.