# Utilisateurs FR de PKP, vers un groupe d'expert Ce document de travail vise à initier un groupe français des utilisateurs des logiciels du consortium PKP. Les premiers utilisateurs ciblés sont ceux qui utilisent OJS pour publier avec le format HTML, c'est à dire a minima (en 2023) U. Bordeaux, Métopes, OPUS et la revue Cambouis. Le document présente (i) le contexte et objectifs du groupe (ii) les caractériques inhérentes à OJS & OMP et (iii) liste des _plugins_ permettant de publier au format HTML avec OJS. <br /> ## Contexte En 2023 trois acteurs français institutionnels utilisent le logiciel libre OJS pour publier le format HTML. La publication de ce format dans l'environnement PKP n'est pas prévue par defaut et recquiert un certain nombre de choix technologiques. Comme le montre le tableau ces trois acteurs n'utilisent pas les mêmes technologies. Aussi, d'autres institutions françaises ont manifestés leurs intérêts pour utiliser OJS de façon similaire : l'utilisation française d'OJS pour publier notamment en HTML se développe. | Plateforme/prototype| nb revues | OJS/OMP | outil conversion XML| publie HTML|HTML techno | | -- |:----:|:----:|:---:|:-----:|:----:| | [U. Bordeaux revues](https://open.u-bordeaux.fr/journals/)|11| OJS 3.2| _ad hoc_ |:heavy_check_mark: | _ad hoc_ | [OPUS-journals](https://emerging-neurologist.org/)| 1 | OJS 3.3 & OMP 3.3|Métopes | :heavy_check_mark: | JATSParser plugin | [Cambouis/Métopes](https://www.revue-cambouis.org/index.php/cambouis) | 1 | OJS 3.3 | Métopes| :heavy_check_mark: | Lens Galley Viewer Les choix et développements effectués au niveau institutionnel pour publier en HTML dans OJS -- et plus largement dans les appropriations faites des technologies de PKP -- ne sont pas coordonnés. Un "groupe d'expert" français permettrait d'aligner les connaissances de ces logiciels entre les différents acteurs et, plus fortement, d'optimiser l'investissement français effectué dans ces technologies et communautés. Le "groupe d'expert PKP" est pour l'heure (2023-08) un projet, qui sera rendu public lors de la journée du 19 septembre [_Livre, Science Ouverte et logiciels libres de PKP_](https://opus2023.sciencesconf.org). Sa réalisation pose diverses questions dont certaines sont encore en suspens, par exemple: * Quel périmètre d'action ? s'agit-il de coordonner tous les acteus français des logiciels PKP ou bien uniquement ceux qui les utilisent pour publier au format HTML ? * Quel corps politique pour héberger le groupe ? <br /> ## Préalable : PKP et la logique de "galleys" Dans la conception native d'OJS et OMP le format HTML des articles scientifiques est envisagé comme un format externe, à l'instar des formats PDF, EPUB, XML. Dans "OJSMP", ces formats extérieurs, contenant le plein texte des articles, sont appelés des _Galleys_ : >A Galley is the final publication-ready file that has been prepared for readers and will be published on the article page. Galleys should be in a stable non-editable format (e.g., HTML, PDF, ePub, or XML) versions of the full-text article [source](https://docs.pkp.sfu.ca/learning-ojs/en/production-publication) Côté lecteur, lorsqu'on se rend sur la page d'un article scientifique (appelée _landing page_) OJS, avec une configuration d'usine, affiche uniquement les métadonnées : titres, résumé, références, DOI, auteurs, affiliations etc. Pour accéder au contenu le lecteur _doit cliquer_ sur le format mis à disposition par le journal : HTML, EPUB ou PDF. Voici quelques exemples : * la revue [jurnalku.org](https://jurnalku.org/index.php/jolas/article/view/182) qui publie du PDF * la revue [journal.culanth.org](https://journal.culanth.org/index.php/ca/article/view/4372) publiant HTML et PDF * et enfin [foodandnutritionresearch.net](https://foodandnutritionresearch.net/index.php/fnr/article/view/9268) qui publie 4 formats : HTML, PDF, EPUB et XML JATS. Ces formats sont donc des éléments détachés du noyau d'OJSMP et afin de les intégrer il est nécessaire d'ajouter des plugins. Pour le HTML le plugin d'usine est nommé _HTML Article Galley plugin_, pour le PDF il se nomme _PDF.JS PDF Viewer_, pour la visualisation du XML JATS, _Lens galley viewer_. Cette conception du format HTML comme un format extérieur est une des caractérique principale d'OJS. Relevons une différence avec Lodel (logiciel libre également) d'OpenEdition. Ce dernier publie nativement le plein texte en HTML de tous les articles. Lodel est ainsi conçu avec une synonymie entre accès ouvert et publication du plein texte HTML. A la différence OJS reste agnostique vis à vis des formats d'édition (HTML, EPUB, PDF, XML ...), il est conçu pour publier les métadonnées sur la landing page et le contenu de l'article dans un format et fichers détachés. ### Sur la compréhension des logiciels PKP La compréhension de ces logiciels doit faire face à au moins deux difficultés : la logique de plugin, qui étend indéfinimement les fonctionnalités, et d'autre part les évolutions : les développements prévus et en cours réalisés par PKP. Sur ce second point, retenons bien que PKP travaille à réduire cette mise à distance du format HTML, en intégrant le format XMLet pour l'édition et pour l'exposition : > Note: PKP is currently working on a project to automate the conversion of Microsoft Word documents into other formats, including XML, HTML, PDF, EPUB, etc. Keep an eye on our blog for updates. [doc PKP OJS 3.4](https://docs.pkp.sfu.ca/learning-ojs/en/production-publication#format-article-for-publication) Pour connaître les évolutions futur de ces logiciels on pourra consulter la [roadmap](https://pkp.sfu.ca/roadmap), laquelle précise que pour la prochaine version (3.5 prévue pour 2025) il est prévu "Add basic support for JATS XML files". <br /> ## Des solutions pour publier en HTML avec OJS et OMP ### Le plugin d'usine _HTML Article Galley plugin_ Avec ce plugin les utilisateurs doivent charger un HTML dans OJS. Un avantage est qu'ils sont libres d'utiliser la technologie qu'ils souhaitent pour le produire ce format. Cette fonctionnalité est par exemple utilisé avec OPUS-OMP. Le HTML est produit avec Métopes (XMLMind) à partir du format XML-TEI, il est ensuite chargé dans OMP avec les images et la feuille de style. Ci-après un extrait de la documentation PKP avec des conseils pour produire du HML à partir d'un fichier openOffice > - Convert the Word document. You can use this free online tool to do an initial conversion. > - Open the resulting HTML files in a text editor (e.g., NotePad in Windows) or HTML editor (e.g., Adobe Dreamweaver). From here, you will need to make any final clean up or formatting. Understanding the basics of HTML is required. There are many free tutorials, but it does take some time. > - Keep the HTML formatting basic. Just focus on paragraphs, line breaks, headings, and links. Don’t worry about fonts, colours, or other design elements - OJS will take care of all of that automatically as part of the overall journal design. > - Upload to OJS as an HTML galley file > - The HTML viewer renders HTML files within an iframe, which may affect navigation to hyperlinked web pages. You can bypass this feature by opening hyperlinks in a new browser tab, by adding the target="_blank" attribute to your href tags. [source](https://docs.pkp.sfu.ca/learning-ojs/en/production-publication#format-article-for-publication) <br /> Enfin, deux exemples de revue OJS qui publient en HTML avec ce plugin * [Cultural Anthropology](https://journal.culanth.org/index.php/ca/article/view/4434) (U.S.) * [Evidence Based Library and information practise]( https://journals.library.ualberta.ca/eblip/index.php/EBLIP/article/view/29621) (Canada) ### Le [Lens Galley Viewer](https://github.com/asmecher/lensGalley) plugin * Exemple [revue-cambouis.org](https://www.revue-cambouis.org/index.php/cambouis/article/view/97/141) * Description depuis un article de l'université artique de Norvège (Odu et al. 2020) : > Lens Galley viewer plugin integrates eLife Lens for OJS 3.0. Lens Galley viewer is a well-developed tool that displays the full text in a separate window, with flexible navigation options. However, it is not optimized for display on mobile phones and tablets. It did not work in OJS 3.1 and 3.2, and it collides with Texture plugin (as pointed out in the PKP Community Forum) ### Le [JATSParser plugin](https://github.com/Vitaliy-1/JATSParserPlugin) * Exemple : [emerging-neurologist.org](https://emerging-neurologist.org/article/view/37) * Description depuis un article de l'université artique de Norvège (Odu et al. 2020) : > The JATS Parser plugin parses JATS XML and displays it on the article’s abstract page in OJS (the landing page for the article’s DOI) as HTML. The plugin also allows to opt for uto-generation of a PDF from the XML: a PDF link is then shown on the article abstract page. The plugin parses JATS content (`<body>` and `<back>` sections), whereas metadata, such as title, author and article abstract, are extracted from the submission metadata in OJS. Elements such as figures, formulas and footnotes still need to be implemented in the plugin. JATS Parser [work with Health Science theme] ~~does not work in all OJS themes, and works on OJS 3.2.x, but not on OJS 3.1.x (which Septentrio currently is based on)~~. Nevertheless, despite these shortcomings, JATS Parser at the moment is the best solution for the Presentation stage. ## Le plugin de Bordeaux * Exemple [oeno-one.eu](https://oeno-one.eu/article/view/7441) * Description Univ. Bordeaux Le module de conversion prend en entrée un document docx/odt qu'il va décomposer et transformer : une conversion directe en pdf, puis une transformation en jats/xml et xhtml. Le module analyse le document envoyé, pour y repérer les titres, auteurs, dates, résumés, mot clés, références bibliographiques, notes de bas de pages, images et formules mathématiques. Une détection automatique de la langue du document permet de mieux analyser le document et ainsi d'extraire optionnellement des mots clés et analyser les références bibliographiques au format APA - une détection d'auteurs, de titre, volume, édition, pages... est effectuée - et de repérer les citations dans le corps de texte. Cette analyse du document permet donc une extraction de métadonnées transmises à OJS (titre, résumé, auteurs...) et une conversion en xml normalisé JATS et XHTML. Ce module est autonome écrit en Java, et interrogé via son API par un plugin spécifique pour OJS 3.3 . Le plugin est chargé de récupérer les documents convertis et de les intégrer à l'article sous forme d'épreuves, dont le xhtml sera utilisé pour l'affichage de l'article. Le xhtml généré est standardisé pour être utilisé par n'importe quel thème. ## Le plugin xml2html de Métopes * pas encore en production * Description Métopes : Le plugin [xml2html-pkp-plugin (intranet)](https://git.unicaen.fr/fnso/fairest/xml2html-pkp-plugin) développé dans le cadre du [projet FNSO FAIR-EST](https://www.ouvrirlascience.fr/fairest/) par l’IR Métopes et par le [Certic](https://www.certic.unicaen.fr/home/) permet l’intégration de flux XML aux systèmes OJS et OMP (version 3.3.0) et leur diffusion en HTML plein-texte en complément d’une éventuelle diffusion des versions PDF. Son développement répond au souci de s’affranchir des implémentations du modèle JATS sous jacent aux plugins existants – parfois partielles et insuffisantes pour l’exposition des contenus propres aux SHS. Ce plugin est donc bâti sans contrainte interne de modèle de représentation de données. Une transformation XSLT effectuée à partir de fichiers sources divers en entrée (TEI Commons, JATS, BITS…) permet la génération des pages HTML ; outre les possibilités d’extension en termes de données traitées, le plugin autorise une large personnalisation des éléments d’affichage des pages HTML (template, CSS, javascript). La conversion d'un flux XML-JATS (JATS Publishing 1.2) ainsi que le déploiement des images associées sont déjà (2023-08) implémentés ; une transformation pour des fichiers-sources XML-TEI (TEI Commons Publishing) est en cours de finalisation. ## Références Bosman, Jeroen, Frantsvåg, Jan Erik, Kramer, Bianca, Langlais, Pierre-Carl, & Proudman, Vanessa. (2021). OA Diamond Journals Study. Part 1: Findings. Zenodo. https://doi.org/10.5281/zenodo.4558704 Maciocci, Giuliano. (2017). Welcome to eLife 2.0 blog post. eLife science, https://elifesciences.org/labs/c8e0dddf/welcome-to-elife-2-0 eLife (2013). Seeing through the eLife Lens: A new way to view research, blog post. elife science. https://elifesciences.org/inside-elife/0414db99/seeing-through-the-elife-lens-a-new-way-to-view-research Odu, O., & Ekanger, A. (2020). How we tried to JATS XML. Ravnetrykk, (39), 156-162. https://doi.org/10.7557/15.5517 <br /> <br />