Mission projets numériques, programmation 2021
===
## 0. Contexte
- un nouveau projet structurant : ANR E-NDP avec un recrutement en cours (pour 2 ans)
- une infrastructure pour l’HTR en cours de montage avec Inria (Cremma)
- des discussions à venir pour la création d’un ou deux nouveaux postes (Biblissima+)
- recrutement de Sarah Rigaudeau (Adele), Aurélie Massie (Lettres), Valentin Sentis (ThENC@)
- une dotation budgétaire : 42 500 EUR en "Fonctionnement", à dépenser donc ; aide au dév et maintenance / à titre indicatif : 55 jours Logilab (pas loin de 3 mois !).
Objet de notre échange :
- définir ensemble les objectifs et le calendrier
- mettre en place l’organisation utile
### 0.1. HTR, infrastructure Cremma
Objectif : se doter d’une infrastructure et d’un réseau pour l’HTR.
Projet soutenu par le DIM Map : [https://www.dim-map.fr/projets-soutenus/cremma/](https://www.dim-map.fr/projets-soutenus/cremma/)
- Projet monté en partenariat avec Inria.
- Financement acquis
- Phase de confinement
- Retombée attendue pour plusieurs projets ENC : Mer des histoires, ANR E-NDP, etc.
- Objectif : monter l’infrastructure au 1er semestre 2021 (achat des machines, etc.).
### 0.2. ANR E-NDP
Projet porté par le LAMOP (Paris 1) : Julie Claustre-Mayade, Darwin Smith
Le projet ANR E-NDP (Notre-Dame et son cloître : les lieux, les gens, la vie) est consacré à l’étude du chapitre de Notre-Dame de Paris, c’est-à-dire de la communauté des chanoines qui, aux côtés de l’évêque, administre la cathédrale. À travers son activité, il s’agit de mieux cerner les modalités de gestion de la cathédrale du XIIIe au XVIe siècle, mais aussi le rôle du chapitre dans la vie intellectuelle et économique de la ville.
- Financement d’un poste pour 2 ans.
- HTR de l’ensemble des 27 registres (Transkribus/Cremma)
- Annotation et exploitation scientifique
- Partage du corpus produit
- Édition fine de 2 registres
### 0.3. Biblissima+
Prolongement de l’Equipex Biblissima. Notre demande : 2 IR pour 4 ans, sur 2 axes (éditions et TAL)
- 1 poste pour les éditions : TEI + DTS (animer la communauté SHS sur les questions d’édition numérique, assurer/suivre les développements logiciels utiles).
- 1 poste pour le "Centre de ressources computationnelles pour le latin et les langues gallo-romanes" : maintenir et partager les ressources et modèles pour les langues gallo-romanes, ainsi qu’une suite d’outils d’annotation.
Perspective : discussion budgétaire à prévoir selon la dotation effective pour des recrutements qui devraient intervenir en 2022.
## 1. Adele
Objectif : déploiement de l’application en test (classe avec OGJ) ASAP
TODO par ordre de priorité :
- mettre à jour le projet : [https://github.com/chartes/adele-app/projects/5](https://github.com/chartes/adele-app/projects/5)
- suivi de Logilab pourle plugin d’annotation des images (bon dialogue des API adele et IIIF)
- reprise des vocabulaires (paries du discours, etc.) pour permettre à SR de remplir ses missions
- refinaliser la page de gestion des comptes (dashboard admin)
- résolution des problèmes de workflow
- page de création de document
- finalisation de la documentation
- habillage (validation Cixous + implémentation Denis)
Moyens :
- 10 jours Logilab
- Vacation Sarah Rigaudeau (3 mois à partir du 1er février + 100h de vacations)
- Budget fonctionnement pour la finalisation de la maquette
Calendrier :
## 2. Positions (encpos) / DTS
Objectif : mise en ligne DTS des positions de thèses (XML+images) pour le bicentenaire
TODO :
- Data
- validation des fichiers XML
- validation des métadonnées
- reprise/validation de l’entrepôt IIIF
- API
- **!** développement du résolveur DTS (MyCapitain + Nautilus) !
- s’assurer de l’intégration des services avec ThENC@
- **!** bien structurer le projet MyCapitain sur le compte chartes
- Site
- Indexation : définition du besoin (scenario de recherche / accès aux positions)
- Mockup
- Conception/intégration de la maquette
- Proposer une structuration du projet
NB. API DTS : ne pas finaliser le resolver DTS : se contenter des routes et méthodes utiles.
Moyens :
- recrutement de Valentin Sentis : travail sur la donnée
- API DTS : *code review* de Julien sur les PR de CF
- API DTS : - envisager une collaboration avec Bridget / Matt Munson ?
- Budget fonctionnement pour le dev Elastic ?
- Budget fonctionnement pour la maquette graphique
Calendrier :
## 3. DicoTopo (app)
Objectif : *Release*
TODO :
- finaliser les crédits et l’historique du projet
- finaliser la documentation des API
- route `capabilities` ?
- sérialisation Linked Places OK ? cf `docs/linked-places.md`
- vérification/traitement des alertes sécurité :
- [https://github.com/chartes/dico-topo-app/security/dependabot](https://github.com/chartes/dico-topo-app/security/dependabot)
- [https://github.com/chartes/dico-topo-vue/security/dependabot](https://github.com/chartes/dico-topo-vue/security/dependabot)
- mise à jour du projet : [https://github.com/chartes/dico-topo-app/projects/1](https://github.com/chartes/dico-topo-app/projects/1)
- abonnement GéoPortail ?
- validation de l’inscription Pelagios (écrire à Rainer Simon) ?
- concevoir une roadmap ouverte = lister les projets possibles à suivre:
- reprise de l’utilitaire d’import
- citabilité des recherches
- recherche, filtre par date
- recherche, filtre par *feature type*
- recherche, filtre par coordonnées géo
- géolocalisation des lieux ?
- ouverture en écriture
- application mobile ?
## 4. Pyrrha
Objectif : *Release*
TODO :
- mettre à jour le projet : [https://github.com/hipster-philology/pyrrha/projects](https://github.com/hipster-philology/pyrrha/projects)
NB. Perspectives possibles de financement (Genève).
## 5. Deucalion
- Objectif, habiller Deucalion : [https://dh.chartes.psl.eu/deucalion/](https://dh.chartes.psl.eu/deucalion/)
- Proposition : [http://mikaelcixous.net/projets/Deucalion/?deuca_home](http://mikaelcixous.net/projets/Deucalion/?deuca_home)
- TODO : revoir l’éditorialisation de la page et faire suivre les éléments au graphiste.
- NB : revoir la distribution des modèles avec TC.
## 6. Lettres
Objectif : déployer l‘application en test en 2021
TODO :
- valider et verser la dernière livraison Isako (correspondance Médicis, tomes 1 et 3)
- mise à jour du projet : [https://github.com/chartes/lettres-app/projects/2](https://github.com/chartes/lettres-app/projects/2)
- prévoir habillage de l’application
Moyens :
- Embauche d’Aurélie Massie (à programmer)
- Mobiliser des crédits CTHS ?
## 7. PTM, projet cartulaires
Objectif : produire un modèle pour l’annotation des lieux (NER) dans le corpus des cartulaires franciliens.
- Partenariat avec EHESS (Carmen Brando) et ENS Lattice (Frédérique Mélanie) + JB Camps.
- 2 annotatrices : Elena Ghiringhelli et Marguerite Vernet
- Rédaction d’un guide d’annotation : [https://github.com/chartes/cartulaires/tree/ner](https://github.com/chartes/cartulaires/tree/ner)
- Annotation en cours des fichiers
- Travail probable avec Sergio Torrès
- Retombée attendue notamment pour le projet E-NDP
## 8. Définition et documentation de l’infrastructure numérique
Objectif : présentation au CS de l’École mi février.
TODO : documentation + synthèse.
### 8.1. Missions : mise en place de l’infrastructure numérique ENC
Rappel des missions essentielles :
- des images
- des référentiels
- des éditions
### 8.2. Infrastructure
- un entrepôt Github ([https://github.com/chartes](https://github.com/chartes)), ordonné par type de projet. Par ex. pour les éditions : [https://github.com/search?q=topic%3Atei+org%3Achartes](https://github.com/search?q=topic%3Atei+org%3Achartes)
- un serveur IIIF : [https://iiif.chartes.psl.eu/](https://iiif.chartes.psl.eu/)
- un serveur de dev : [https://dev.chartes.psl.eu/](https://dev.chartes.psl.eu/)
- un serveur de prod : [https://dh.chartes.psl.eu/](https://dh.chartes.psl.eu/)
- un serveur pour les apprentissages
- une infrastructure en cours de montage pour HTR (Cremma, Inria)
- backup : géré par le CRI ?
### 8.3. Un service pour l’indexation plein texte ?
Plusieurs applications proposent de l’indexation plein texte (Elastic) :
- DicoTopo
- Encpos
- Lettres (à venir)
- Adele (sans doute)
Comment on standardise ça chez nous ?
### 8.4. Documentation des applications ?
On a besoin d’un espace partagé pour la documentation non publiable (les comptes et abonnements, etc.) – Par ex. compte Géoportail
Comment on standardise ça ? – revoir la structure du dossier partagé.
### 8.5. TODO
- mettre à jour les pages d’accueil des serveurs de dev et de prod.
- revoir et documenter l’organisation du serveur IIIF : [https://docs.google.com/document/d/1AHT2Cy8hHSWL-dWAoOxCYPeb3U2FxYiLhlxiq9YaNV0/edit?usp=sharing](https://docs.google.com/document/d/1AHT2Cy8hHSWL-dWAoOxCYPeb3U2FxYiLhlxiq9YaNV0/edit?usp=sharing)
- revoir la page d’accueil du serveur IIIF
- partager enfin les différents corpus iconographiques
- documenter la procédure de backup du CRI
## 9. Tâches prioritaires
### Vincent
- RH : finalisation du recrutement ANR E-NDP
- RH : entretiens individuels
- Infrastructure : documentation IIIF et validation (enfin) avec Régis Robineau
- Infrastructure : pages d’accueil (dev et prod)
- Infrastructure : préparer la communication au CS
- Infrastructure : suivi Cremma
- Recherche : suivi du projet PTM Cartulaires
- DicoTopo : documentation (application et API)
- DicoTopo : inscription Pelagios ?
- Adele : suivi de la documentation et reprise de la maquette
- Positions : suivi des opérations DTS
- Deucalion : suivi de la conception et de l’intégration de la maquette
- Lettres : validation des livraisons et intégration des données
- Miroir des classiques
### Julien
- bouclage Adele
- Correction divers
- Suivi de Sarah (correction des bugs prioritaires)
- Suivi Logilab (Mirador)
- Implémentation du back office
- Gestion utilisateur (invitation, whitelist)
- Gestion document (ajout, suppression)
- Amélioration de la recherche (tri, plein texte, filtre date)
- Amélioration des textes d'aide (short desc des données des référentiels, description des étapes de constitution d'un dossier)
- Finir la page d'aide / projet
- Ajouter une légende des signes utilisés par Alexandre ([]{}", <>, etc)
- Peer Review le code DTS avec Corentin
- Réfléchir au frontend
- bouclage Dicotopo
- Publier une release des deux projets
- Réfléchir à l'intégration d'une maquette graphique / version mobile
- Implémenter les filtres pré-recherche
- Améliorer les exports LP
- bouclage Lettre
- Corriger les bugs existants (fonctions, personnes et lieux ?)
- Implémentation du back office
- Gestion utilisateur (invitation, rôle)
- Gestion document (ajout, suppression)
- Gestion des référentiels
- Formulaire de recherche avancée
- Suivi de l'intégration de la maquette graphique (?)
- Désinstaller supervisor en dev et en prod et utiliser des services systemd
- Poursuivre mon apprentissage (non supervisé) du ML et trouver des cas d'étude à ma portée.
### Corentin
- Dicotopo
- Continue de l'intégration des DT et réception du travail d'Olivier et Sébastien
- Positions
- Partie Donnée :
- Structurer les données avec une procédure de contrôle
- Compléter les métadonnées manquantes dans les TEI comme dans le tsv (voir avec Valentin)
- Ajout de métadonnées
- Mise en place d'une norme XML pour permettre d'automatiser la Capitainisation. Actuellement ça part du TSV pour rentrer les medatada et ça serait mieux de partir des fichiers TEI à l'avenir car c'est qu'on va partager
- Assurer de l’intégration des services avec ThENC@ avec l'appel directement des identifiers depuis le futur site ThENC@ pour faire le lien
- Faire en sorte que les images appelées par ThENC@ des différentes positions de thèses correspondent
- CapitTains :
- Réécrire CapitainsDtsPassage et CapitainsDtsText pour délivrer les passages d'un texte
- Ecrire PrototypeDtsNode,PrototypeDtsText, PrototypeDtsPassage dans ressources sur l'exemple de PrototypeCtsNode, PrototypeCtsText, PrototypeCtsPassage
- DTS doit pouvoir appeler les sous-partis d'un texte
- Choisir si on implémentante l'ancienne version pour l'encodingDesc ou si on passse à la nouvelle version
- Bien structurer le projet MyCapitain sur le compte chartes
- Site Web :
- Faire un mockup du site avec proposition pour un site
- Réfléchir au front-end et faire différentes propositions