owned this note
owned this note
Published
Linked with GitHub
Sprint HAL-SWH-IES - 2021
================================
###### tags: `sprint` `sofwtare preservation` `HAL` `CCSD` `SWH` `cool`
**Table des matières**
[TOC]
## Liens
- [Sprint rapport 2020](https://hackmd.io/oDOJi2qXROW74DBO0pDsig)
- [Notes des réunion 2020](https://hackmd.io/@HAL-SWH-IES/r1T9W4tHI/edit)
- [FAQ](https://hackmd.io/mQulGhsbToKK4Gb2pYRgZw)
- [Proposition réponse CGAL](https://hackmd.io/44zx1KxNS-e-GD03iv0pWQ)
- [Specification scénario SWHID](https://hackmd.io/yUZAp78KTdSvE4drf0_MqQ)
- [Export CodeMeta](https://hackmd.io/g_6J8cBETBi66R9AvPAGOA)
## :dart: Objectifs 2021
1. interaction sur la nouvelle proposition UI/UX concernant les fiches logiciels (dépôt, modération, export)
2. Exports logiciel
- CodeMeta, BibTeX, TEI
- Vérifier autres exports (DCTERMS, EndNote)
3. Import par lots (FNSO)
4. Implémentation nouveau scénario SWHID
- avec SWHID dans le nuage
- parsing fichier codemeta.json et preremplissage formulaire de depot
5. revoir le format de la citation
6. documentation et guides (dépôt et modération)
7. communication du nouveau scénario SWHID (potentiellement avec une partie qui cible les utilisateurs de la forge Inria)
8. HAL DATA ? intégration des logiciel dans HAL DATA serveur virtuoso (triple store) du ccsd
9. Modules de logiciel
- Liens (dynamiques) depuis et vers les logiciels (proposition?)
- L'utilisation d'une collection
-------------------------------------------------
## Réunion 22 Janvier 2021
### Participants
- CCSD (Bruno Marmol, Yannick Barborini)
- Software Heritage (Roberto Di Cosmo, Morane Gruenpeter)
- IES-Inria (Jozéfina Sadowska, Estelle Nivault, Alain Monteil)
### Agenda
1. Revoir les objectifs 2021
2. Avancement scénario SWHID avec SWHID dans le nuage
3. Nouvelle proposition UI/UX
4. question sur CITATION.cff
5. proposition pour prochaine réunion lundi 22.2 ou vendredi 26.2
### Notes
#### 1. Revoir les objectifs 2021
- UI/UX
- deuxième phase
- Exports
- Citation.cff? conversion depuis un codemeta.json.
- pas la priorité
- vérifier clients Zotero (Better BibLaTex)
- champs supplémentaires à ajouter
- quel est le workflow Zotero? quelles étapes manques?
- schema.org dans l'html?
- TEI, codemeta, BibTex
- Vérifier autres exports (DCTERMS, EndNote)
- CITATION.cff
- deuxième draft "Software Metadata Recommended Format guide (SMRF)" créé par la communauté SPN: https://docs.google.com/document/d/1BksirmfepnYOhkVIL_IlD-0Kr5PHZ7d3wUI8sAorwCs/edit?usp=sharing
- format JATS
- comment prendre en compte des besoins logiciels
- format du papier en entier
- episciences - custom meta (plus du standard)
- JATS => TEI
- détection type logiciel
- Import par lots (FNSO)
- l'institution prépare le dépôt par lots
- répondre à l'appel d'offre (quand celui-ci sera sorti)
- sous-traitant
- X-to-HAL? X2HAL? (assistance semi-automatique pour information de qualité)
- à adapter pour les logiciels
- ouverture d'X2HAL et construire la communauté autour
- trouver un pilote
- Modules
- ==ACTION: Morane à mettre à l'agenda de la réunion en mars==
#### 2. Avancement scénario SWHID avec SWHID dans le nuage
- avec SWHID dans le nuage
- parsing fichier codemeta.json et preremplissage formulaire de depot
- commencer en décembre
- en cours de dev
- remplir le formulaire
- ==ACTION: Yannick à vérifier avec Théophanne quand il sera de retour==
- Beta-testeurs: IES-Inria, Roberto
#### 3. Nouvelle proposition UI/UX
"L’étude UX/UI est toujours en cours sur la partie administration. Mais sur la partie « utilisateur déposant », nous sommes en train de faire l'intégration.
Coté logiciel :
- la landing page d’un logiciel va changer. 2 sections sont propres aux logiciels dans la vue actuelle :
- les métadonnées spécifiques
- le lien vers SWH
- Le dépôt change également pas mal. J’ai encore des interrogations de manière générale. On doit en discuter en interne. " (YB)
- validation de la fiche logiciel à la prochaine réunion
#### question sur CITATION.cff
- Citation.cff? conversion depuis un codemeta.json.
- pas la priorité
#### Avancement implémentation structure signante en tant qu'auteur collectif
- calendrier? deuxième semestre?
- livraison au minimum fin 2021
- terminer le référentiel auteurs
- Solutions en attendant:
1. donner guidelines de comment faire sans la structure signante pour être capable de les retrouver (les auteurs collectif)
- ==ACTION: Estelle + Jozefina à regarder comment c'est déjà fait==
2. nom collectif à mettre de côté par un modérateur
#### proposition pour prochaine réunion lundi 22.2 ou vendredi 26.2
- 22/02/2021 14h
## Réunion 22 Février 2021
### Participants
- CCSD (Bruno Marmol, Yannick Barborini)
- Software Heritage (Roberto Di Cosmo, Morane Gruenpeter)
- IES-Inria (Jozéfina Sadowska, Estelle Nivault, Alain Monteil)
### Agenda
1. Ressource humaines sur le projet dépôt logiciel
- IES-Inria en manque de ressources perte de 1.7 etp pour le moment pas remplacé
2. Avancement scénario SWHID avec SWHID dans le nuage
- vérification du SWHID
- utilisation du codemeta.json (si celui-ci existe)
- dépôt sur SWH métadonnées seules sur SWHID
3. Retour journée EOSC
- Open citation
4. RADAR- évolution du rapport d'activité
5. Proposition pour prochaine réunion fin avril
### Notes
#### 1. Ressource humaines sur le projet dépôt logiciel
- IES-Inria en manque de ressources perte de 1.7 etp pour le moment pas remplacé
- investissment moindre dans le projet logiciel
- plusieurs actions qui sont mise de côté
- modération des logiciels => allonges le traitement (INRIA)
- modération des dépôts logiciels qui ne sont pas INRIA sont fait au CCSD
- campagne CRAC? (CNRS- point d'entrée HAL)
- seulement texte intégral
- capacité de modération est faible sur tout les types de dépôts
- modération par portail=> aller vers une vraie démarche (pas tant de portail modère)
- control différent sur portail INRIA et sur le CCSD
- légimité de l'autorité, l'institut et non pas l'infrastructure
- CCSD != CNRS
- rédaction des guides par le biais des acteurs
- conditions à partir de SWH (nous, SWH, on veut absolument certains fichiers)
- politique INRIA
- levier du chercheur => valoriser le logiciel
- inscription dans une écologie nationale
- amélioration de la citation pas au niveau institutionnel
- CasuHAL
- effet vitrine (BSO- baromètre science ouverte)
- item logiciel
- consortium software repositories (Alain reste)
- retour d'expérience des participants
- une réunion par mois 1 heure (présence Alain)
- JATS (seulement Laurent)
#### 2. Avancement scénario SWHID avec SWHID dans le nuage
- modifié les métadonnées sur un logiciel existant sur pre-prod (à tester)
- ==DONE Morane tester la modification de métadonnées et l'envoi à SWH==
- utilisation du codemeta.json (si celui-ci existe)
- ==DONE Morane trouver des exemples de SWHID avec CodeMeta==
- ==DONE Yannick pousser en preprod==
- vérification du SWHID
- contrôle du dépôt sur SWH métadonnées seules sur SWHID (pas de notice sans SWHID)
- pas accepter côté CCSD de dépôt notices seules avec SWHID
- vérification de la citation est bonne
- ==DONE: Morane rencontrer les modérateurs CCSD (retour modération/modérateurs logiciel)==
- calendrier => Avril-Mai
#### 3. Retour journée EOSC (point reporté)
- Open citation
- groupe de travail typologie de HAL
- remonter le type logiciel
- évolution de la typologie des `documents`
#### 4. RADAR- évolution du rapport d'activité
- Ecran d'affichage de Radar voir tout ce qui concerne le Logiciel
- voir le GT chercheurs citation Logiciel ?
- equipe Radar est preneur de toutes remarques idées propositions
- changement de la manière de rechercher en modération (avec l'indexation axe modérateur)
-
#### 5. Proposition pour prochaine réunion fin avril
- 19 Avril 14.00
## Réunion 06 mai 2021
### Participants
- CCSD (Bruno Marmol, Yannick Barborini)
- Software Heritage (Roberto Di Cosmo, Morane Gruenpeter)
- IES-Inria (Jozéfina Sadowska, Estelle Nivault, Alain Monteil)
### Agenda
1. Avancement scénario SWHID avec SWHID dans le nuage
- vérification du SWHID
- utilisation du codemeta.json (si celui-ci existe)
- dépôt sur SWH métadonnées seules sur SWHID
2. Guides de dépôt et de modération (avec SWHID)
3. Communication (quand? Qui? Comment? Forge Inria avec SWHID?)
3.1 Forge Inria : message à Florian Dufour et David Rey Tous les projets de la forge Inria sont archivés.
4. tableau Metadonnées / TEI de Yannick : liste des métadonées et voir celle qui sont dans la TEI voir avec Laurent Romary après analyse
5. Modules (reporté)
- Liens (dynamiques) depuis et vers les logiciels (proposition?)
- L'utilisation d'une collection
6. Date et sujets pour prochaine réunion : 14/06/2021 14 h
### Notes
#### SWHID dans le nuage
1. auteurs non parses dans le CodeMeta (la raison est que dans codemeta on n'a pas la decoupe du champs nom dans ses composants elementaires - c'est un champ texte simple)
2. Pour codeMeta : voir pour nom comment reconnaitre le prénom et le nom. Communauté de codemeta quels est la convention ? given name family name
3. affiliation des auteurs même règle au moins un des auteurs doit être affilié - actuellement ce n'est pas le cas, la même règle que pour les images, à modifier la configuration de l'interface de dépôt de Hal pour les logiciels
4. Domaine obligatoire mais pas déduit de codemeta on laisse à saisir par le déposant ne pas oublier les préférences du déposant pour les affiliations et les domaines par défaut
5. En modération : ajouter des informations aux modérateurs : Code repository
6. Utiliser systematiquement SHWID (et pas "swh") pour les identifiants Software Heritage dans l'interface HAL (e.g.: dans le menu des identifiants, ou dans l'interface de moderation)
7. Verifier le atom:create-origin": "hal-01243573" qui à l'air d'être codé en dur pour tous les depots qui arrivent sur la preprod
8. Parser le ORCID si present dans le CodeMeta
9. taux de présence du CodeMeta chez Software Heritage :
```
split_part | count
----------------------------+-------
bitbucket.org | 7
forge.softwareheritage.org | 1
github.com | 1137
gitlab.com | 14
hal.archives-ouvertes.fr | 1
pypi.org | 9
salsa.debian.org | 4
```
10. si SWHID pas de codemeta alors création du dépôt sans aucune récuparation de métadonées revoir le message pour éviter l'abandon
11. si pas de codemeta, recuperer au moins le SWHID et le type "Logiciel"
12. ==DONE: Morane - vérifier la mise à jour des métadonnées des dépôts HAL==
13. 8 Juin atelier CasuHAL (espace tests)
14. nouvelle version guides fin mai
15. mettre en prod avant le 8 juin? pas une obligation
## Réunion 14 juin 2021
### Participants
- CCSD (Bruno Marmol, Yannick Barborini)
- Software Heritage (Roberto Di Cosmo, Morane Gruenpeter)
- IES-Inria (Jozéfina Sadowska, Estelle Nivault, Alain Monteil)
### Agenda
1. Retour des journées CasuHAL
- X2HAL
- Dépôt logiciel
2. Avancement scénario SWHID avec SWHID dans le nuage
- vérification du SWHID
- utilisation du codemeta.json (si celui-ci existe)
- dépôt sur SWH métadonnées seules sur SWHID
3. Documentation dépôt logiciel avec SWHID
- Guides de dépôt et de modération (avec scénario SWHID)
- Docs sur HAL
4. Communication passage en prod (quand? Qui? Comment? Forge Inria avec SWHID?)
5. Les prochaines étapes:
5.1. Auteur collectif
5.2. Modules
- Liens (dynamiques) depuis et vers les logiciels (proposition?)
- L'utilisation d'une collection
6. X2HAL pour les logiciels
8. Planifier la prochaine réunion en september(6 ou 13 septembre)
### Liens
- https://inria.halpreprod.archives-ouvertes.fr/hal-02523010
- presentation CasuHAL : https://docs.google.com/presentation/d/18F5ka95CGU7MewKWiv_A-yNXq_owlMOWYpwoLrlklyI/edit?usp=sharing
- tests et bugs du scénario SWHID: https://hedgedoc.softwareheritage.org/EL4a-5BERT6wCY92lLfSNA
### Questions & remarques
- Serait-il possible de donner accès à preprod à l'équipe Sorbonne-universités pour les formations?
- changer sur le formulaire les intitulés de status sur le texte explicatif du status de dévlopment:https://www.repostatus.org/
### Notes
1. Retour des journées CasuHAL
- X2HAL (id de personnes)
- BibTeX
- tables rondes
- epiSciences ([JTCam](https://jtcam.episciences.org/))
- style biblio
- présentation à l'ensemble des revues episciences
- JOT
- accompagnemant science ouverte
- Directrice CCSD
- collaboration logiciel
- lien SWH et HAL
- SWH
- Atelier valorisation du dépôt logiciel
- question modération
- question plusieurs rôles : pas possible pour le moment mettre le principal ou celui que la personne veut valoriser
2. Scenario SWHID
- résolutions des cas d'erreurs sur le codemeta.json non exploitable
- origin qui revient (tests unitaires)
- les choses à faire:
1. SWHID à transmettre dans le formulaire
2. messages rouge= > pas une vrai erreur
3. récupération des auteurs
- SWHID
- Jeu de données de tests (avant septembre)
- Episciences
- IFIP depuis Github
- jeux de codemeta.json lié à Swhid
- Beta test du Scénario SWHID (à partir de septembre)
- pool de volontaires a solliciter
- Benoit Baudry
- Remy Gribonval
- Pierre Alliez
- Roberto Di Cosmo
- Alain Girault
- Arnaud Legrand
- Julia Lawall
- Nicolas Rougier
- Monique Teillaud
- Ouverture sur HAL-Inria dépôt de notice avec SWHID
- Ouverture sur toutes les instances => modération
- ==DONE: Morane envoyer la liste à Yannick (préparé par Valentin)==
- ==ACTION: Morane avec l'équipe IES-Inria créer un jeu de donné de bon codemeta.json==
- ==DONE: Morane prendre rendez-vous avec Agnès==
- pôle de modérateurs par thématique/type de dépôt
- codemeta.json dans le .zip?
- possible techniquement
- ne pas utiliser le SWHID s'il existe dans le .zip
- vers fin 2021
3. Documentation
- Guides:
- partir de la situation du chercheur
- 2 réunion Morane + IES-Inria
- Docs sur HAL:
- ==DONE: Morane à voir avec Agnès==
4. Communication
- Beta-test : campagne de communication
- Forge -Inria
- flash sur intranet Inria
- ==ACTION: Alain poster message "news" intranet sur la notice avec SWHID==
- Deux options de communications:
1. Notice sur SWHID
- déjà fonctionnel
3. SWHID dans le nuage
- effet wow
- DECISION: option 1 sur Inria avant septembre
- DECISION: option 2 sur tout HAL vers mi-octobre
- voir préparation de la campagne vers mi-octobre avec Agnès
5. Prochaines étapes
5.1. Auteur collectif
- structure signante
- algo déposé à l'équipe CCSD - à voir côté interface
- personne morale
- ref d'entité
5.2. Modules
6. X2HAL pour les logiciels
- A la recherche de la maîtrise d'ouvrage
- INRAE
- l'université de Rennes 1
- https://wiki.ccsd.cnrs.fr/wikis/hal/index.php/Outils_et_services_d%C3%A9velopp%C3%A9s_localement_pour_am%C3%A9liorer_ou_faciliter_l%27utilisation_de_HAL
- Guillemette Blachot? Laurence Farhi auparavant
Prochaine réunion 6.9.2021 à 14h
## Réunion 6 septembre 2021
### Participants
- CCSD (Bruno Marmol, Yannick Barborini)
- Software Heritage (Roberto Di Cosmo, Morane Gruenpeter)
- IES-Inria (Jozéfina Sadowska, ~~Estelle Nivault~~, Alain Monteil)
### Agenda
1. Nouvelles:
2. Avancement scénario SWHID avec SWHID dans le nuage
- vérification du SWHID
- utilisation du codemeta.json (si celui-ci existe)
- dépôt sur SWH métadonnées seules sur SWHID
2. Documentation dépôt logiciel avec SWHID
- Guides de dépôt et de modération (avec scénario SWHID)
- Docs sur HAL
3. Communication passage en prod (quand? Qui? Comment? Forge Inria avec SWHID?)
4. Les prochaines étapes:
4.1. Auteur collectif
4.2. Modules
- Liens (dynamiques) depuis et vers les logiciels (proposition?)
- L'utilisation d'une collection
6. X2HAL pour les logiciels
7. Planifier la prochaine réunion en octobre
### Notes
1. Nouvelles:
- plan national
- EOSC
- CCSD- catalogue national
- Les universités-Sorbonne
- planning de formation
- formation des modérateurs
- Le logiciel devient une des productions scientifiques et vous avez intérêt de prendre la main sur ces documents
- inter-etablissement ou institutionellement
- Open Science -> aspect sur lequel nous pouvons faire levier
2. Modération
- quelle stratégie pour la modération
- campagne de formation avec la bénédiction du CCSD
- CasuHAL
- équivalent équipe IES-Inria dans les établissment
- INIST-CNRS
- INRAE
==ACTION: Bruno & Yannick préparer le terrain pour les questions de modération en dehors du CCSD grâce à une formation==
==ACTION: Laurent & Roberto proposition officielle à Nathalie pour la formation (à un niveau politique)==
==ACTION: créer lien avec l'Inist (Agnès)==
3. Avancement scénario SWHID avec SWHID dans le nuage
specs: https://hackmd.io/yUZAp78KTdSvE4drf0_MqQ
test: https://hedgedoc.softwareheritage.org/EL4a-5BERT6wCY92lLfSNA?both
2.1 Checklist Scénario SWHID
sur le formulaire:
- [x] SWH => SWHID dans le nom de la propriété
- [x] dans le nuage
- [x] sur la page de modération
> [name=Yannick Barborini]normalement, nous avons remplacé SWH par SWHID dans toute l'interface
- [x] SWHID à transmettre dans le formulaire (quand il n'y a pas de codemeta)
> [name=Yannick Barborini]Vérifier si le fonctionnement convient. exemple avec le SWHID swh:1:dir:d278402e677dee4dc6c8ab7cccdd5a0f0730afee
- [x] messages rouge quand il n'y a pas de codemeta => pas une vrai erreur
- [x] récupération des auteurs (formats des auteurs- nom, prenom)
- suivre format dans codemeta-generator
> [name=Yannick Barborini]Les auteurs sont récupérés :
> - en priorité si il y a les balises givenName et familyName
> - sinon en récupérant l'information dans la balise name (format "prénom nom" comme sur l'exemple swh:1:dir:001efb26b31ad1644dfe37ef1b188023e3a647ea)
> - le mail et l'orcid sont récupérés s'ils sont présents
- [x] bloquer les notices sans SWHID
- [x] vérifier l'existance du SWHID (avec l'appel API https://archive.softwareheritage.org/api/1/resolve/doc/)
- [x] transfer sur SWH des métadonnées
- [x] vérifier les dépôts de métadonnées sur SWH
- [x] case à dé-cocher pour transfert chez SWH
==ACTION: Morane à vérifier le deposit-id==
2.2
Nous avons 3 cas aujourd’hui :
- Dépôt initial d’un zip logiciel avec des métadonnées :
- le dépôt dans HAL doit répondre aux critères suivants :
- un fichier zip doit être déposé
- le zip ne doit pas être sous embargo
- le zip doit être déclaré comme « fichier auteur »
- le dépôt doit être de type « SOFTWARE »
- le dépôt ne doit pas avoir de SWHID
- au moment de la mise en ligne dans HAL, on transfert dans SWH et on récupère le deposit-id (requête POST)
- Nous avons ensuite un cron qui récupère le SWHID à partir du deposit-id
- Mise à jour des métadonnées :
- lors de la modification des métadonnées dans HAL, on envoie les nouvelles métadonnées grâce au deposit-id (requête PUT)
=> pour le moment ce cas ne fonctionne que si on a fait un dépôt initial et qu’on a le deposit-id
- Dépôt d’une notice logicielle avec identifiant SWHID :
- Que faire dans ce cas ?
- un dépôt initial ? Ou une mise à jour de métadonnée ? Dans ce second cas il faudrait le deposit-id ?
2.3 Sujets à voir
- les dépôts SWHID sont dans la liste *Références bibliographiques en ligne*
- les dépôts source sont dans la liste *Documents en ligne*
- Présentation à SciCodes programmée pour le 21/10 mais Séminaire IES Alain fait un message à Alice pour reporter au 18/11/2021 ou plus tard
1.2 Workflow
1.2.1 Scénario SWHID - Chercheur
```mermaid
sequenceDiagram
Participant Researcher
Participant Forge
Participant HAL
Participant SWH
Researcher->>Forge: creates repository
Researcher->>Forge: update content
Researcher->> SWH: save code now
SWH ->> Forge: fetch complete sw history
SWH ->> SWH: ingest project
Researcher->> SWH: fetch SWHID
Researcher->> HAL: submit SWHID with metadata (or/and codemeta)
opt moderation
opt deduplication
HAL-->>SWH: check existence of the same bundle
end
alt revision required
HAL-->>Researcher: request for modification
else is accepted
HAL-->>Researcher: notify deposit accepted (extrinsic identifier for the deposit)
else rejection
HAL-->>Researcher: notify reasons for rejection (e.g. deposit doesn't contain metadata files)
Researcher->>Forge: update repository
Researcher->> SWH: save code now
Researcher->> SWH: fetch new SWHID
Researcher->> HAL: update new SWHID
HAL -->> SWH: moderator checks new SWHID and content
HAL-->>Researcher: notify deposit accepted
end
end
HAL-->>Researcher: publish deposit with HAL-ID and SWHID
```
1.2.2 Scénario SWHID - Modérateur
```mermaid
sequenceDiagram
Participant Moderator
Participant HAL
Participant Researcher
Participant SWH
Participant Forge
loop moderation
Moderator->>HAL: choose a sw deposit
HAL-->>Moderator: present sw metadata and SWHID
Moderator->>HAL: click on SWHID (and open new window)
Moderator->>SWH: check metadata files in sw
alt is accepted
Moderator->> HAL: validate and publish deposit
HAL-->>Researcher: notify deposit accepted
HAL-->>HAL: publish deposit with HAL-ID and SWHID
else modifications needed
Moderator->>HAL: request for modification - add/modify files
Moderator-->>Researcher: notify reasons for rejection (e.g. deposit doesn't contain metadata files)
Researcher->>Forge: update repository
Researcher->> SWH: save code now
Researcher->> SWH: fetch new SWHID
Researcher->> HAL: update new SWHID
HAL-->> Moderator: notify deposit ready to new moderation
end
end
```
6. Processus de modération
- pas effacer le SWHID
7. Réunions
- 28.9 Morane avec IES-Inria
- 30.9 Morane avec Yannick
- Journée HAL 20.10 (sur place ou virtuelle)
## Réunion IES-Inria + Morane (28.9)
### Agenda
-
### Notes
#### journée HAL - 20 Octobre
- baromètre science ouverte
- repérage et identification entre publication et logiciel
- état des lieux scénario SWHID
- vue deposit administration sur SWH
- préparation formation modération (16 Novembre)
- guide de dépôt
- guide de modération
- roadmap 2022:
- paternité (authorship)
- auteur collectif
- auteur vs contributeur
- modules / collection
- EOSC
- 30 nov
#### Formation modérateurs Inria (16 Novembre)
- [x] inviter Agnès Magron
- DONE préparer formation
#### Guides
##### Guide de dépôt
- ajouter explication sur la modification du SWHID
##### Guide de modération
- réfléchir aux phrases de modération avec save code now
#### Test dépôt et modération dépôt SWHID
1. que ce passe t'il avec un rechargement des métadonnées?
2. récupération de la même license à chaque rechargement de métadonnées
3. il faut trouver un moyen de changer le SWHID sans que le modérateur efface le SWHID
## Journée logiciel - HAL+SWH (20 Octobre)
### Participants
- CCSD (Bruno Marmol, Yannick Barborini)
- Software Heritage (Roberto Di Cosmo, Morane Gruenpeter)
- IES-Inria (Jozéfina Sadowska, Estelle Nivault, Alain Monteil)
### Agenda
- baromètre science ouverte
- repérage et identification entre publication et logiciel
- 30 nov journée Unesco
- roadmap 2022-2025:
- paternité (authorship)
- auteur collectif
- auteur vs contributeur
- modules / collection
- EOSC
- insertion de lien SWHID (ou dataset) - EpiScience (JTCAM)
- gestion de la métadonnée relation
- état des lieux scénario SWHID
- vue deposit administration sur SWH
- préparation formation modération (16 Novembre)
- guide de dépôt
- guide de modération
### Notes
#### baromètre science ouverte (BSO3)
Le repérage et identification entre publication et logiciel
- Alain:
- Laurent Romary, Laeticia Bracco (Université de Lorraine), Anne L'Hôte
- expertise et connaissance côté IES - particpation IES
- finacement permettra de travailler avec Patrice Lopez?
- dans la roadmap 2022
- via Grobid et via Datcite, Open Citation
- Roberto:
- financement conséquent
- mining dans les pdf (liens vers le logiciel)
- l'histoire sur golden dataset: économie, médicine -> détection particulière
- Bruno:
- lien avec la BIL
- sémantiquement compliqu
- rechercher des logiciels de la BIL (avec les noms des logiciels)
- Roberto:
- travaille n'a pas commencer
- liste d'éléments (noms, urls, liens sur des forges, SWHID) à croiser avec d'autres informations qualifiées
- essayer une cartographie de mention de logiciel
- Bruno:
- faut positif et faut négatif
- prévoir un outil de contrôle
- ouvrire des deux côté pour dire "oui" uo "non" -> modération
- Roberto:
- travaille énorme pour qualifier
- aller plus loin
- payer une boîte dehors
- ajouter les outils de curation
- garanti de la qualité grâce aux humains qui sont derière
- Projets Européen avec SwMath- un dataset qualitatif
- golden dataset
- Estelle:
- est ce que l'on note les mentions logiciels sur les article?
- Roberto:
- oui absolument
- système pour aider les anotateur
- machine learning supervisé
- à Austin
- Poser la question à Patrice
- Alain:
- ajouter IES-Inria
- ouvre un axe d'investissement
- repérage
==ACTION: vérifier avec Moritz comment ça marche sur swMath==
==ACTION: demander une présentation courte==
- Roberto:
- les dépôts logiciel sur HAL est un corpus
- pour les logiciels fermés- déposer quand même les notices
- vrai données pour
- fiches qui passent pas par les modérateurs => valorisation
- Bruno:
- quel logiciel valoriser?
- qui est capable de dire qiel logiciel?
- dans la BIL il y a un workflow
- il faut quelqu'un qui valide le logiciel dans le corpus
- c'est de l'évaluation
- Roberto:
- l'effort de déposer est un filtre
- Alain:
- metriques c'est ailleurs
- Bruno:
- ajouter un workflow valorisation sur la partie privée
- Il faut se méfier de:
- une métadonnée est en écriture seulement par un rôle
- par exemple: seuls les acteurs d'un workflow
- Roberto:
- avoir tous sur HAL - avec le même schéma de métadonnées
- proposer un service à tous le monde
- workflow de valorisation (comme sur la BIL)
#### 30 Novembre
lien de recommendations Science ouverte UNESCO (à trouver)
==DONE: envoyer le programme par mail==
#### roadmap 2022-2025:
- Collections d'items
- paternité (authorship)
- auteur collectif
- auteur vs contributeur
- modules / collection
- EOSC
- insertion de lien SWHID (ou dataset) - EpiScience (JTCAM)
- gestion de la métadonnée relation
HALiance - projet ANR (https://www.ccsd.cnrs.fr/projets-laureats/) axe 4 : Articulation des publications, des données et des codes sources de la recherche
- Open citation?
- travaille fait sur EOSC pillar
#### SWHID
- alléger le processus aux chercheurs et aux modérateurs
- créer un outil côté HAL/SWH pour vérfier si les documents existent sur un SWHID
- proposition de Bruno:
- pop-up / case à cocher
- annotation automatique du SWHID actuel
- supression du SWHID actuel de la notice
- Calendrier
- ==DONE: 16-22 Novembre mise en prod du scenario SWHID (sur HAL-Inria)==
- ==DONE: IES-Inria et Morane tester la preprod + lors de la formation prendre les avis sur la suppression du Swhid==
- ne pas supprimer le SWHID (mais l'ajouter dans l'annotation)
##### Réponses prédéfinies
1. ajouter un readme sur votre code repository
2. faire un nouveau "save code now"
3a.supprimer SWHID actuel
3b. copier le nouveau SWHID dans la notice sous la propriété "identifiant" (et non pas dans le nuage)
4. ajouter dans le message au modérateur votre nouveau SWHID!!
5. assurez-vous de cliquez sur + et cliquer sur "valider le dépôt" en bas de page
- SWHID actuel (qui doit changé) swh:1:dir:79b8c8755dbed34f01a6a7184ffc196f3c58cb5d;origin=https://github.com/moranegg/AffectationRO;visit=swh:1:snp:3d73c454047658280dbbf7a5fbc3c25f788d4a37;anchor=swh:1:rev:44c5ef119c5af14193b5a9322d34c34c395e4c8b
==DONE: Morane ouvrir tickets SWH sur les amélioration de la vue de modération==
==DONE: Yannick ouvrir tickets HAL sur les messages d'erreurs et autres message==