---
title: Réunion du 20 juin 2022 en vue de la préparation du séminaire SoDUCo-BNF - Séance 2/4 - Annuaires
tags: SoDUCo, Annuaires
robots: noindex, nofollow
langs: fr
---
# Documents en cours :
- Recensement des présences-vacances des membres du groupe soduco jusqu'au 10 novembre: https://hackmd.io/spVTPV2RQ4-90P4_F5pVJA
- Notes sur la mesure de la qualité des annuaires: https://hackmd.io/siWqN7unRTWWdaRn2uS2Cw
**Réunion de préparation (20/06/2022) - Séance Annuaires du séminaire Bnf-SoDUCo**
# Annonce de la réunion
Bonjour à tous,
Nous avons prévu de nous réunir lundi prochain (20 juin) pour préparer la session collaborative de la seconde journée SoDUCo- BNF, qui je vous le rappelle aura lieu le 10 novembre.
Je propose que, pour ceux qui le peuvent, nous nous retrouvions à partir de 9h00 dans la salle B04-01 de l'EHESS (54 Bd Raspail, 75006 Paris) avec l'idée de commencer la réunion au plus tard à 9h30.
Nous prévoyons aussi un lien de visioconférence pour ceux qui ne pourront se déplacer : https://meet.jit.si/soduco
L'ordre du jour proposé pour cette réunion est ici :
- Nous commencerons par un point sur le programme de la journée et les études de cas envisagés.
- Nous poursuivrons par une session de travail SoDUCo sur les extractions, les exploitations, les analyses en cours et l'organisation des opérations à venir (les personnes moins intéréssées par ces question pourront ainsi être libérées plus tôt). Cette séance peut se poursuivre l'après midi (la salle est réservée pour toute la journée).
Je crois que chacun reconnaitra les parties où il peut intervenir et/ou le cas échéant se coordonner avec d'autres.
N'hésitez pas à ajouter des choses si nécessaire.
Bien amicalement,
PAscal Cristofoli
PS:
- Les notes de la précédente réunion (09/05/2022) sont accessible ici : https://hackmd.io/BBjXFQfIQoO2MwHvXqj1dw
- en cas de problème de connexion vidéo, merci de prévenir par mail, un autre système pourra être utilisé via le lien suivant : https://webinaire.ehess.fr/b/cri-cok-ntf
# Point préparation de la Journée :
Point sur le programme de la journée et les études de cas envisagés
## Reunion Soduco-Bnf sur les annuaires
10 juin - Bnf - Présents: Philippe Chevallier, Ange Aniesa, Cristina ion, Eve Netchine, Jean-Dominique Mellot, Julie Gravier, Viera Rebolledo-Dhuin, Stéphane Baciocchi, Pascal Cristofoli.
A faire du coté BnF :
- Invitation à Christian Laucou, imprimeur et typographe ( cf. http://clstypo.fornax.fr/) (Jean-Dominique Mellot) / possibilité d'une rémunération sur facture : si accord de principe, Pascal prendra le relais.
- Transmission d'une liste de sources complémentaires sur les répertoires professionnels de Libraires (Jean-Dominique)
Pour la journée, côté BnF, nous aurions :
- Le matin : une entrée "corpus et méthodologie" le matin (Jean-Dominique), avec intervention en complément de Christian Laucou sur la composition des annuaires
- une entrée l'après-midi sur les éditeurs de cartes (département Cartes et plans : Cristina ?) + Un travail sur les catalogues de l'ibraires (Eve)
Et du côté Soduco :
- constitution d'une liste de numérisations complémentaires ou de renumérisations, avec priorités
(des spécifications de numérisations à prévoir ?)
## Organisation concrète :
- Programme : Le programme prévisionnel de la journée est accessible sur le document suivant : https://hackmd.io/TRqowWgITeGr12WZm11MlA
- Repas :
- Invitations:
- Site web/affiche
# Point SoDUCo traitement des annuaires :
Faire un point en distinguant les étapes générales et ce qui peut-être fait pour la journée du 10/11.
## Point Extraction
https://cloud.lrde.epita.fr/s/ekRt5MbE5KHbHDd
## Point Julie & Pascal
### Gestion et Qualité des données
#### Indicateurs pour juger de la qualité
- des versions numériques des ouvrages pdf
- de l'OCR
- du NLP
- de la reconnaissance des boites/entrées
- Repérer des pages similaires entre 2 volume d'une collection donnée ? (cf travail sur la typographie)
#### QuiestCharlie dans SoDUCo (qualité de de la numérisation et de la reconnaissance) : retrouver les "agents de change" dans les listes alphabétiques.
#### Extraction de professions ou de
- étude de cas Médecins et de la santé à Paris:
https://hackmd.io/lYpC-ImRQvOvGIY_sZMQtA
### Recensement des informations :
#### Accès aux différents documents de synthèse :
Bilan au 20 juin: [Inventaire](https://fr.overleaf.com/project/613b56dfa0a5df70c42d28ee) et [Tableau synthéique](https://fr.overleaf.com/project/615d87b65fba99f4badc6cc4)
Données originales :
- Fichier tabulaire de recensement des ouvrages
- Fichier tabulaire de recensement des listes d'adresses
=> Ces fichiers constituent les métadonnées des entrées (collection et séries d'appartenance de l'ouvrage, nom et type de liste,...)
Intégration des informations dans les json de sortie (au niveau page et au niveau de l'entrée)
=> Intégration dans le catalogue SoDUCo: fichiers pdf ou/et liens métadonnées ? (Automatisation ?)
### Données démographiques sur Paris et le département de la Seine.
Saisie des données de population au niveau :
- des quartiers
- > les quartiers avant 1860 (données spatiales du programme Alpage) et après 1860 (reconstitués à partir des IRIS, voir la [documentation](https://github.com/JGravier/soduco/blob/main/reunions/2022_06_20/documentation_quartiers_paris_post_1860.pdf))
- > saisie population des années: 1801, 1817, 1831, 1836, 1841, 1846, 1851, 1856, 1861, 1866, 1872, 1876, 1881, 1886


- des communes du département de la Seine
- Autres type d'infos
## Point sur le travail de Solen
## Point sur le travail de Julie et Marc
Voir [presentation](https://github.com/JGravier/soduco/blob/main/reunions/2022_06_20/soduco_reunion_20_juin_2022.pdf)
## Discussion sur le processus de traitement et la procédure de travail compte tenu des différents chantiers.
### Production nouveau jeu de données (V1-11/10)
### Un premier Traitement général de type openrefine ?
### Pour le 10/11 : Disposer d'une visu simple
Exemple pour une page donnée : Page source image + page résultat (tableau) + carte associée avec mesure de la qualité et stats ?
## Nécessité de travailler sur les plans:
- Verniquet
- Jacoubet
# Ressources:
Répertoire de Partage sur Huma-num :