18 sept. 2019~Atelier de travail correspondancefamiliale.ehess.fr
---
Présents :
- Patricia Bleton
- Pascal Cristofoli
- Bertrand Dumenieu
- Francine Filoche
- Danièle Poublan
Excusé : Guillaume Quéruel
# Bilan
## Etat actuel et sauvegarde du site
- Le site correspondance familiale fonctionne toujours et son contenu éditorialisé est accessible tant que le service de la comm de l'EHESS maintient ses serveurs lodel (la date de fermeture est inconnue).
- Une déclaration du site a été faite à la BNF (Dépôt légal) : https://catalogue.bnf.fr/ark:/12148/cb44259405d . La BNF fait régulièrement des copies du site (l'ensemble du site sous forme statique ? (à vérifier). Le site est aussi archivé sur Internet Archive : http://web.archive.org/web/20190414164735/http://correspondancefamiliale.ehess.fr/ (mais seuls les pages correspondantes au liens de premier niveau hiérarchique sont archivés)
- Le service de la comm de l'EHESS qui maintient lodel a donné accès à une sauvegarde (*dump*) du site et de la base de données lodel associée (sauvegarde datée de septembre 2019).
- La sauvegarde du site a été analysée par Bertrand (cf. ci-dessous). Il apparait que nous avons accès à toutes les "briques" et les "liens" du site. - Selon les solutions techniques qui seront choisies, un travail (plus ou moins important) de migration de ces informations et données vers le nouveau système sera sans doute possible. Il sera nécessaire d'associer étroitement Danièle au controle de la phase de migration.
- Trois solutions ont été envisagées :
- Drupal 8 (site de l'EHESS)
- Mediawiki (cf. ex: http://lakanal-1795.huma-num.fr/wiki/Pr%C3%A9sentation )
- Lodel 1.0 (cf. revue.org)
- le choix du nouvel outil doit tenir compte de plusieurs critères:
- Adaptation des outils au sujet et "pérénité" de ces solutions
- Gestion de l'installation, maintenance technique et fonctionnelle des outils
- Possibilité et quantité de travail exigé pour assurer la migration du site
- Possibilité de faire des mises à jour et des ajouts de contenu pour des utilisateurs non "informaticiens"
- Partage de l'expérience avec d'autres groupes, projets...
- Danièle imagine des fonctionalités supplémentaires pour le site, il faut voir si celle-ci sont implémentées.
- Une premières exploitation des données du site est possible (fréquences, liens entre les gens, citations...).
## Alimentation et mise à jour du site par D. Poublan
- L'alimentaion du site avec de nouvelles données est interrompue depuis juillet 2019 (suite à l'arrêt de Servoo qui permettait de charger des fichiers word "stylés" dans la base de données MySql et ainsi d'alimenter et d'indexer le site).
- Depuis juillet, Danièle travaille en local les fichiers word correspondant aux nouvelles lettres (elle fait bien attention à noter dans un coin du fichier les liens qui devraient être faits, vers les pages actuelles du site ou vers de nouveaux documents).
- Si un nouveau site voit le jour, Danièle devra mettre à jour le carnet de recherche associé au site (notamment les liens vers les documents du site). Cette mise à jour risque d'être manuelle.
- Quand les outils auront été choisi, et que la migration aura été faite, une phase de vérification du contenu et un accompagnement à la manipulation du nouveau dispositif (formation) seront nécessaires.
# Décisions pour le prochain atelier
:::success
- Dépot des fichiers du site, du *dump* de la bdd mysql et des fichiers de données (tables csv, images, sources) sur Didomena : Bertrand créée l'archive, Danièle+Francine+Patricia procèdent au dépot.
- Se renseigner sur l'outil derrière l'édition de la correspondance de Flaubert (https://flaubert.univ-rouen.fr/) (@Guillaume?). Danièle estime que c'est le site qui se rapporche le plus du site actuel.
- Fixer une date qui permette la présence de Joachim Dornbusch.
- Identifier les utilisateurs de Wikimedia à l'EHESS, ou au moins au CRH pour savoir s'il y a une communauté existante à l'école autour de cet outil
- Rassembler des retours sur Drupal 8 et si possible tester l'outil. Est-ce un outil adapté à l'édition électronique de lettres ? Faut-il des développements spécifiques pour afficher un équivalent du site *correspondance familiale* actuel ? pour permettre à un non informaticien de le mettre à jour et de rajouter de nouvelles données ?
- Se renseigner sur le coût d'externalisation du transfert des données du *dump* vers un nouvel outil, ou réfléchir à sa possible internalisation (qui? dans quelles conditions? etc.)
- Dresser un petit tableau comparatif de Drupal 8 / Mediawiki / Lodel 1.0 selon divers critères (difficulté de transfert des données depuis le site actuel, soutien institutionel de l'école, difficulté de maintenance, maturité, richesse et modularité, fonctionnalités majeures, facilité d'édition et d'import, etc.
:::
## Suite donnée aux décisions ci-dessous :
### 18/09/2019 15h00, Mail de Guillaume : Prise de contact avec la BNF et avec l'équipe du projet Flaubert
Pour info j'ai conctacté la BnF et l'équipe du projet Flaubert. Je vous tiendrai informés des réponses que j'obtiendrai.
### 18/09/2019 17h00, Mail de Bertrand : Sauvegarde propre du site et des données en vue de l'archivage sur Didomena
Bertrand nous envoie les fichiers .zip correspondant aux données brutte du site:
I ] Le fichier contenant toutes les données (images, documents Word, exports des tables de la base de données au format CSV) : donnees.zip (2.4 Go)
II ] Le fichier contenant la sauvegarde complète du site Web correspondancefamiliale.ehess.fr: correspondancefamiliale.ehess.fr.zip (2.6 Go)
En l'état actuel, Didomena ne peut charger des fichiers aussi gros de manière classique (via les formulaires). Bertrand a écrit à Joachim pour voir s'il y avait une autre solution.
# Travail préliminaire à la réunion : rétro-ingénierie de la bases de données mysql de correspondancefamiliale
La base de données est celle de LODEL 0.9, apparement adaptée aux spécificités des sites EHESS et de nouveau adaptés ( ou au moins utilisée d'une façon détournée) pour le site correspondancefamiliale.ehess.fr.
La plupart des tables semblent être propres à LODEL et ne contiennent pas vraiment les données des correspondances. Je les ignore et ne cherche que celles qui ont du contenu interessant. De même pour les tables suffixées "_OLD", que je considère par principe obsolètes.
Le coeur de la base données des correspodances est formé des tables
```
lodel_textes // Contenu des lettres, notes de bas de pages, etc.
lodel_persons // Contenu des index Signataires, Destinataires et Auteurs des citations
lodel_entries // Contenu des index Personnes citées et Adresses
lodel_fichiers // Tous les liens vers les fichiers joints aux articles
lodel_entities // Contient la hierarchie des éléments du site.
```
Elles sont liées selon le schéma suivant^[la bdd mysql ne contient a priori aucune clé étrangère explicite, mais il y en a plusieurs implicites que j'ai reporté.].

Ainsi, la [Lettre d’André Marie Constant Duméril (Paris) à sa mère Rosalie Duval (Amiens) (identity=722)](http://correspondancefamiliale.ehess.fr/index.php?722) est en relation avec 7 éléments :
```sql
SELECT * FROM correspondancefamiliale.lodel_textes WHERE identity=722;
-- identity, titre, soustitre
-- '722', 'Vendredi 16 septembre 1803, 29 fructidor an XI', 'Lettre d’André Marie Constant Duméril (Paris) à sa mère Rosalie Duval (Amiens)', ...
SELECT * FROM correspondancefamiliale.lodel_relations WHERE id1=722;
-- idrelation, id1, id2, nature, degree
-- '28510', '722', '4', 'E', '1' -- lodel_entries 'Paris'
-- '28511', '722', '17', 'E', '2' -- lodel_entries 'Amiens'
-- '53275', '722', '303', 'G', '1' -- lodel_persons André Marie Constant
-- '53274', '722', '473', 'G', '1' -- lodel_persons Rosalie Duval
-- '28512', '722', '694', 'E', '3' -- lodel_entries 'Frédéric Cuvier' (cité dans le texte)
-- '7997', '722', '5845', 'P', '1' -- lodel_fichiers page1
-- '8002', '722', '5846', 'P', '1' -- lodel_fichiers page1
```
Grace à a table `lodel_relations`, on peut facilement lier chaque lettre à son signataire, son destinataire, aux personnages cités et aux scans du document.
À l'inverse, connaitre tous les documents dont une personne est signataire, destinaire, ou elle se trouve citée :
```sql
-- Le nombre de documents où Frédéric Cuvier est cité
SELECT count(*) FROM correspondancefamiliale.lodel_relations WHERE id2=694 AND nature='E'
-- 5
-- On vérifie ici : http://correspondancefamiliale.ehess.fr/index.php?page=entree&id=694
-- Il y a bien 5 entrées
```
Certaines colonnes des tables ont une utilité particulière. Je liste ici celles que j'ai pu identifier.
```
------
# Table lodel_persons
idtype : Si =12493 -> index des signataires. Si =12491 -> index des destinataires. Si =12492 -> index des auteurs de citations.
------
------
# Table lodel_entries
idtype : Si =12449 -> index des personnes citées. Si =12451 -> index des adresse. Cf. la table lodel_persontypes
------
------
# Table lodel_relations
nature : Si ='E' -> une ligne de la table lodel_entries. Si ='G' -> une ligne de la table lodel_persons. Si ='P' -> une ligne de la table lodel_fichiers.
degree : semble correspondre à un niveau dans la hierarchie des index, à partir de l'item courant. Les noeuds enfants directs ont un degré de 1, les noeuds enfants des noeuds enfants un degré 2, etc.
------
```
## Autres remarques :
Les index "Biographies" et "Monographies" sont des textes dans la table lodel_textes, ce ne sont pas des indexes.
Je ne comprends pas à quoi correspond les tables `lodel_entities`,`lodel_auteurs`, `lodel_indexes`. Peut-être s'agit t-il de tables propres à LODEL mais inutilisées par correspondancefamiliale.ehess.fr?
On dirait que `lodel_textes` contient pas mal de choses différentes : des notices familiales, des lettres, des références à des fichiers, etc.
Les menus de gauche ont l'air d'être générés à partir des éléments de la table `lodel_entities` de types (`lodel_types`) 'Volume' (`id=12486`), 'Rubrique' (`id=12411`).
# Notes de Danièle Poublanc
## Note en prévision de la réunion du 18 septembre
Avenir du site « Correspondance familiale »
http://correspondancefamiliale.ehess.fr/
Réunion 18 septembre 2019 - Danièle Poublan
On peut distinguer trois exigences concernant le site après l’arrêt de LODEL en juillet 2019
1- La conservation de tous les documents déposés sur le site
La conservation est-elle assuré par la BNF, via l’ISSN (ISSN 2425-3200)
https://catalogue.bnf.fr/ark:/12148/cb44259405d
L’archivage électronique. Le Registre International de l’ISSN est le catalogue mondial des publications en série. Les publications en série y sont enregistrées de manière exhaustive.
L’ISSN est donc un outil bibliographique : il permet aux étudiants, chercheurs, rédacteurs de résumés et bibliothécaires de donner les références précises d’une publication en série.
Faut-il ajouter un autre mode de conservation ? Par exemple Didomena ?
2- La consultation du site qui permet de voir :
- sur la même page les fac-similés des lettres et leur transcription
- le texte des lettres avec notes et intertextualité : dans le corps du texte des lettres, des liens renvoient aux biographies, aux monographies et à d’autres lettres
- les documents annexes (biographies et monographies)
- le classement chronologique des lettres par décennies et années et la possibilité de rajouter et déplacer des documents
- les index : signataires, destinataires, personnes citées, lieux de départ et d’arrivée des lettres
et, ce qui serait nouveau par rapport à la forme ancienne du site :
la recherche par mots (par séquences de mots, par co-occurrences, avec les flexions des mots)
3- L’élaboration en continu du site
c’est-à-dire la poursuite du travail par ajout de documents, corrections, reclassements
En novembre 2014 j’avais consulté à ce sujet Nicolas Larrousse et Nadine Dardenne. Au cours de cette réunion il était apparu que NAKALA (le service de préservation des données de la recherche en SHS mis en place par Huma-Num, le très grand équipement du CNRS) n’était pas adapté à ce cahier des charges. Qu’en est-il de Didomena ?
Quelles seraient les solutions possibles pour le site, compte tenu de ces trois contraintes ?
Un échange de courriels en avril 2019 ouvrait quelques pistes :
- Assistance Lodel OpenEdition : migrer vos contenus sur une version à jour de Lodel (1.0) en installant le convertisseur qui remplace Servoo aujourd'hui : OTX. Voir pour plus d'information ici : https://lodel.hypotheses.org/377. »
- A la BU Lyon3 : vous pouvez contacter Bernard Pochet (Popsup https://popups.uliege.be/) ou Cécilia Monteiro (MSH Paris Nord) qui ont réalisé (ou doivent encore réaliser pour Paris Nord ?) une migration vers Lodel 1.0 à partir d’une version sous Servoo. Ces 2 structures font partie du réseau Repères (http://bu.univ-lyon3.fr/reperes-un-nouveau-reseau-professionnel-au-service-des-revues-scientifiques-en-acces-ouvert--1199860.kjsp?RH=1540383422160) dont mon collègue Jean-Luc de Ochandiano a été un des initiateurs.
VOIR aussi :
- Correspondance de Faubert, http://flaubert.univ-rouen.fr/correspondance/edition/index.php
- L’ÉDITION NUMÉRIQUE DE CORRESPONDANCES - Guide méthodologique
https://cahier.hypotheses.org/files/2018/03/Correspondance_CAHIER.pdf
## Note en prévision de la réunion du 9 septembre
Avenir du site « Correspondance familiale »
Réunion 9 septembre 2019
### I- Etat des lieux
### I-1- Les documents proposés sur le site
Ce site présente l’édition scientifique de la correspondance de la famille Duméril-Mertzdorff-Froissart (1783 – 1919).
Les archives privées comptent plus de 3 000 lettres qui témoignent de l’ascension sociale d’une famille qui accumule au fil des générations capital intellectuel, social et économique.
Au départ, André Marie Constant Duméril (1774-1860) étudie la médecine et les sciences naturelles, et poursuit une longue carrière au Muséum. Il écrit régulièrement à ses parents puis à sa femme, racontant ses activités et ses projets, ses rencontres, ses difficultés et ses succès – renvoyant des échos des événements parisiens, de la Révolution au Second Empire.
Caroline, petite-fille d’André Marie Constant Duméril, épouse en 1858 Charles Mertzdorff, industriel du blanchiment des tissus en Alsace. Ils ont deux filles, Marie et Émilie, avant que Caroline ne meure (1862). Une cellule familiale se reconstitue autour de Charles Mertzdorff et sa seconde épouse, Eugénie Desnoyers, elle aussi issue du monde des savants du Jardin des plantes de Paris.
En 1880, Marie épouse Marcel de Fréville, conseiller à la Cour des comptes ; en 1883 sa sœur Émilie épouse Léon Damas Froissart, officier d’artillerie et propriétaire foncier dans le nord de la France. Les quatre fils Froissart et les deux gendres sont mobilisés pendant la guerre de 1914-1918, mais seules la correspondance avec le plus jeune des fils nous est parvenue.
Actuellement sont présentées, fac-similé et transcription, 2 400 lettres (sur plus de 3 000 lettres conservées) : 1 900 lettres de 1783 à 1880 puis, par-delà une rupture chronologique motivée par l’actualité commémorative, 500 lettres de 1914 à 1919.
Les lettres sont transcrites intégralement et accompagnées de leurs fac-similés.
Auteurs, destinataires, dates et lieux d'expédition des lettres ainsi que toutes les personnes citées font l’objet d’index. De courtes biographies sont rédigées pour un certain nombre de personnes citées dans les textes. On accède à ces biographies depuis le texte des lettres.
Quelques monographies (sur les institutions et les lieux) complètent la documentation.
Résumé en chiffres, ce sont 120 signataires différents, 90 destinataires, 4 000 personnes citées, 800 mini-biographies, individuelles ou familiales.
Restent de nombreuses lettres de 1881 à 1914 en attente d’être transcrites, codées, indexées, « intertextualisées », scannées pour compléter la base de données. Toutes les années ne sont pas également riches : la correspondance se raréfie entre 1885 et 1910. Cependant le réseau épistolaire est encore large et vivant. Au début du XXe siècle, les lettres d’Émilie Mertzdorff-Froissart racontent les combats politiques de son époux, notable catholique.
Les lettres en attente permettront de présenter le corpus dans sa continuité, de la Révolution française à 1919.
Dans ce travail en cours, des compléments aux biographies et des corrections au texte des lettres antérieures continuent d'être apportés : le site est un chantier qui, à la fois, ajoute des documents nouveaux et révise les anciens.
### I-2- Les aspects techniques du site sous Lodel
#### Les débuts sous Lodel .7 (2004)
En 2004, un test est effectué avec l’échantillon de 120 lettres présenté dans l’ouvrage et dans la foulée le site « S’écrire au XIXe siècle. Une correspondance familiale » est ouvert.
Méthodologie utilisée pour le site Correspondance familiale
Chaque lettre du corpus est saisie comme un fichier WORD
Ce texte est ensuite mis en forme aux normes de LODEL .7, logiciel d’édition électronique, d’utilisation libre et gratuite, qui
Par ailleurs les lettres manuscrites sont scannées (ainsi que les enveloppes lorsqu’elles existent) en choisissant un mode de numérisation bitonal, avec une définition de 300 dpi.
#### Le passage à Lodel .9 (2014)
La migration est décidée au printemps 2013, mais elle est remise de mois en mois. Elle commence finalement à l’automne 2013.
- Fin janvier 2014. La migration est effectuée ; restent encore quelques réglages à faire. Voir l’optimiste billet de janvier 2014 : « Avec l’an neuf vint Lodel neuf », De Lodel 7 à Lodel 9, une fantaisie en forme de patchwork littéraire (la migration du site, suite et fin – provisoire !) https://puc.hypotheses.org/845
- Mai 2014. Des ajustements sont encore nécessaires (possibilité de lire une lettre après l’autre, mots disparus à restituer, etc.)
[voir annexe 1]
#### Juillet 2019. Arrêt du serveur Lodel.
Le site, en l’état, est consultable, mais toute possibilité d’intervenir sur le site (corriger ou ajouter des documents) est bloquée.
## II- Propositions d’évolution du site
### II-1 Ce qui est à conserver
- le texte des lettres avec notes et intertextualité : dans le corps du texte des lettres, des liens renvoient aux biographies, aux monographies et à d’autres lettres
- les documents annexes (biographies et monographies)
- le classement chronologique des lettres par décennies et années et la possibilité de rajouter et déplacer des documents
- la possibilité de générer des index (signataires, destinataires, personnes citées, lieux de départ et d’arrivée des lettres)
- la coprésence des fac-similés des lettres et de leurs transcriptions
### II-2- Ce qui est à améliorer pour l’utilisation du corpus
(un modèle inspiré de FRANTEXT)
Recherche par mots, par séquences de mots, par co-occurrences, avec les flexions des mots
Isoler des sous-fichiers pour cibler les recherches ci-dessus ; les sous-fichiers seraient constitués
soit à partir des différents index :
par nom des auteurs
par nom des destinataires
par personnes citées
par dates
soit à partir du contenu des titres
ex : lettres à des grands-parents ou à des oncles
# Se renseigner sur l'outil derrière l'édition de la correspondance de Flaubert (https://flaubert.univ-rouen.fr/)
Le logiciel utilisé pour la correspondance de Flaubert est un développement sur mesure utilisant des outils open source standards : `php`, `css`, `javascript` et `MySql`. Les données sont enregistrées dans une base de données `mysql`. Aucune infrastructure de développement supplémentaire n’est utilisée.
La gestion des lettres : image / transcription / codage des informations annexes (scripteur/destinataire/date/lieu de rédaction/lieu de conservation de l’original etc.) se fait dans un module d’administration accessible en ligne qui permet à une équipe de spécialistes de Flaubert de transcrire / relire les lettres à partir des images.
Ce me semble, cela disqualifie d'office cette solution.