Projekthistorie
DFG-Projekt seit 2015 mit Ziel: Volltextdigitalisierung der VD-Bestände (16.-19. Jh.)
2015-2017: Bestandsaufnahme
2018-2020: Entwicklung von Prototypen
1 Koordinierungsprojekt
8 Modulprojekte (v.a. Unis, auch ASV)
2021-2023: Überführung in Produktivbetrieb
1 Koordinierungsprojekt
7 Implementierungsprojekte (v.a. Uni-Bibliotheken)
Prioritäten
Massenverarbeitung > Ergonomie
Transparenz > Perfektion
Module > Black-Box
Spezifikationen > Konventionen
Offenheit, Freie Software, Community
noch nicht: Handschriften, Zeitungen, Gegenwartsdokumente
noch nicht: Robustheit und Skalierbarkeit
Massenverarbeitung
Baut auf Standards (METS-XML, MODS, PAGE-XML, ALTO-XML, JSON-Schema, XML-Schema)
Tools mit einheitlicher CLI (und Web-API…)
Anschlussfähige Technologien (Python, Git, Docker)
Austauschbare Komponenten und flexibel konfigurierbare Workflows
Komponenten
Gängige OCR-Engines führen verschiedene Operationen vor und nach der "eigentlichen" Texterkennung aus, sind an bestimmte Workflows gebunden – nutzerfreundlich aber unflexibel
Freie Workflow-Konfiguration (inkrementelle Annotation)
1 Schritt im Workflow → 1 Aufruf eines OCR-D-Prozessors
Alternative Implementierungen für Prozessoren
"Nimm die Binarisierung von Ocropus, die Segmentierung von Tesseract und die Texterkennung von Calamari"
Leichte Integration neuer Tools
Verbindliche Vorgaben, wie sich die Prozessoren verhalten müssen
Einheitliche Kommandozeilenschnittstellen
Mit Schemasprachen Datenaustausch verifizieren
Konventionen explizit und validierbar machen
Referenzimplementierung https://github.com/OCR-D/core
zum Entwickeln von spezifikationsgemäßen Prozessoren
(Python-API, Bashlib)
allgemeine Nutzerwerkzeuge:
ocrd workspace ...
ocrd process ...
ocrd resmgr ...
ocrd zip ...
ocrd validate ...
Meta-Projekt https://github.com/OCR-D/ocrd_all
enthält alle OCR-D-Module
Zielsystem: Ubuntu 18.04
In Windows 10 per WSL installierbar
Mac OSX: weitgehend kompatibel, aber nicht garantiert
Auch als Docker-Image verfügbar: ocrd/all
plattformunabhängig, funktioniert in Windows, OSX, Linux, BSD …
derzeit nur als "Fat Container" für CLI
GPU-Nutzung nicht trivial (CUDA-Toolkit / Tensorflow / Python -Versionen…)
alle Prozessoren haben ein mehr oder weniger detailliertes README
alle Prozessoren unterstützen --help
zeigt Docstrings, CLI und Parameter-JSON
bspw.: ocrd-olena-binarize -h
Setup Guide beschreibt Installation
Workflow-Guide beschreibt verfügbare Prozessoren und deren Zusammenspiel
Klick auf den Prozessor-Namen öffnet Parameterliste
Beispiele für komplette Workflows am Ende der Seite
Fragen? Probleme? https://gitter.im/OCR-D/Lobby
Prozessor : Implementierung mit OCR-D-CLI für einen oder mehrere Schritte im Workflow
Workspace : Verzeichnis mit einer mets.xml
, die das Dokument und alle weiteren Dateien beschreibt
File Group : Gruppe von Dateien/Annotationen im Workspace, entspricht weitgehend lokalen Verzeichnissen
Parameter : Prozessor-spezifische "Knöpfe an denen man drehen kann", um die Verarbeitung zu steuern
Resume presentation
OCR-D Produktiv (Einführung zu Konzept und Benutzung)¹ Robert Sachunsky, Uni Leipzig, 12.05.2021 https://hackmd.io/@bertsky/HyJgghd_d 1: basiert auf: Konstantin Baierer – https://dhd-ag-ocr.github.io/slides/OCR@vDHd-Z1.pdf https://github.com/kba/vdhd-2021-05-05 https://github.com/kba/vdhd-2021-05-12
{"metaMigratedAt":"2023-06-16T00:16:21.654Z","metaMigratedFrom":"YAML","title":"OCR-D Produktiv","breaks":true,"description":"Einführungsvortrag Leipzig 12.05.2021","slideOptions":"{\"theme\":\"white\",\"slideNumber\":true}","contributors":"[{\"id\":\"c62f1b15-791a-47e1-8e4c-ab2ed00c04bc\",\"add\":6795,\"del\":2778}]"}