# Beispiele OCR-D-Entwicklung (Stand: 30.11.2022) ## Aktuelle Issues und Pull-Requests - Spezifikation: https://github.com/OCR-D/spec/issues (35) https://github.com/OCR-D/spec/pulls (8) - Implementierung/Framework: https://github.com/OCR-D/core/issues (78) https://github.com/OCR-D/core/pulls (20) - Deployment: https://github.com/OCR-D/ocrd_all/issues (26) https://github.com/OCR-D/ocrd_all/pulls (3) - Dokumentation: https://github.com/OCR-D/ocrd-website/issues (31) https://github.com/OCR-D/ocrd-website/pulls (2) - Testdaten/GT: https://github.com/OCR-D/assets/issues (16) https://github.com/OCR-D/assets/pulls (4) ## Dauer für Bugfixing - [`--overwrite`](https://github.com/OCR-D/core/issues/825) und [`make_file_id`](https://github.com/OCR-D/core/pull/861): 6m - [`--working-dir`](https://github.com/OCR-D/core/issues/693) und [`--mets-basename`](https://github.com/OCR-D/core/pull/696): 8m - [Symlinks](https://github.com/OCR-D/core/issues/802): 9m - [`ocrd-dummy`](https://github.com/OCR-D/core/pull/814): >9m... - [`ocrd zip bag`](https://github.com/OCR-D/core/issues/363): >3y ## Dauer für neue Funktionalität - Ressource-Manager, v.a. Dezentralisierung und Modul-Auslieferung (https://github.com/OCR-D/core/issues/689, https://github.com/OCR-D/core/issues/690, https://github.com/OCR-D/core/pull/797, https://github.com/OCR-D/core/issues/691, https://github.com/OCR-D/core/issues/750, https://github.com/OCR-D/core/issues/752, https://github.com/OCR-D/core/pull/753, https://github.com/OCR-D/core/pull/777, https://github.com/OCR-D/core/issues/780, https://github.com/OCR-D/core/pull/800, https://github.com/OCR-D/core/issues/801, https://github.com/OCR-D/core/pull/901, https://github.com/OCR-D/core/pull/904, https://github.com/OCR-D/core/issues/908, https://github.com/OCR-D/core/pull/909, https://github.com/OCR-D/core/issues/916, https://github.com/OCR-D/core/issues/924, https://github.com/OCR-D/core/pull/932, https://github.com/OCR-D/core/pull/933, https://github.com/OCR-D/core/pull/934, https://github.com/OCR-D/core/pull/939, https://github.com/OCR-D/core/pull/940, https://github.com/OCR-D/core/issues/930, https://github.com/OCR-D/spec/issues/193): 10m - METS Caching (https://github.com/OCR-D/core/issues/723, https://github.com/OCR-D/core/pull/875, https://github.com/OCR-D/core/pull/944, https://github.com/OCR-D/core/pull/958): >12m - [partielles Workspace-Klonen](https://github.com/OCR-D/core/pull/582): >2y... - Speicherverbrauchmessung (https://github.com/OCR-D/core/issues/607 https://github.com/OCR-D/core/pull/878 https://github.com/OCR-D/core/pull/929): 1y - [OcrdPage-Fehlerbehandlung](https://github.com/OCR-D/core/pull/576): >2y... - [**Web-API-Spezifikation**](https://github.com/OCR-D/spec/pull/222): >1y... - [**Processing-Server**](https://github.com/OCR-D/core/pull/884): >7m... (eigentlich: [Processing/Workflow-Server](https://github.com/OCR-D/core/pull/652) wartet seit >2y) ## Wartezeit für neue Funktionalität - Softwarebibliothek für Zeichensätze, Transkriptionsregeln und Level-Umrechnung nach GT-Richtlinien zur Nutzung in OCR-Training: >1y... - [selektive Prozessierung nach Kapiteln und Seitentyp](https://github.com/OCR-D/spec/issues/192): 10m... - [Dewarping auf Seitenebene](https://github.com/OCR-D/spec/issues/180): >18m... - [Spezifikation für Evaluator-CLI](https://github.com/OCR-D/spec/issues/172): >2y... - [Spezifikation für logische Dokumentstruktur](https://github.com/OCR-D/spec/issues/142) und [Artikelstruktur](https://github.com/OCR-D/spec/issues/40): >2y... - [CMYK-Unterstützung](https://github.com/OCR-D/core/issues/656): 2y... - [JPEG2000- und JBIG2-Unterstützung](https://github.com/OCR-D/core/issues/526): >2y... - [Unterstützung für Bildwinkel-Metadaten](https://github.com/OCR-D/core/issues/494): >2y... - [**Aufrechterhalten der DPI-Metadaten**](https://github.com/OCR-D/core/issues/343): >3y... - [**Aufrechterhalten der File-URLs in METS**](https://github.com/OCR-D/core/issues/323): >3y... - [fileGrp-Klonen](https://github.com/OCR-D/core/issues/634): 2y... - [erweiterte PAGE-Validierung](https://github.com/OCR-D/core/issues/740): 1y... - [partielle Validierung](https://github.com/OCR-D/core/issues/383): >3y... - [**Erlauben von Dateien, die das gesamte Werk repräsentieren, während der Validierung**](https://github.com/OCR-D/core/issues/485): >2y... - [automatische Validierung](https://github.com/OCR-D/core/issues/555) und [generische Konfigurationsmechanismen](https://github.com/OCR-D/core/issues/376#issuecomment-562349028): >2y... - [**METS-Finalisierung/Bereinigung**](https://github.com/OCR-D/core/issues/544): 2y... - [**API-Änderungen für Parallelverarbeitung und Fehlerbehandlung**](https://github.com/OCR-D/core/issues/322): >3y... - [**Deployment: isolierte Modul-Container**](https://github.com/OCR-D/ocrd_all/issues/69): >2y... - [**Deployment: automatische, realistische Regressionstests**](https://github.com/OCR-D/ocrd_all/issues/112): >2y... - [Deployment: Debian/Ubuntu-Pakete](https://github.com/OCR-D/ocrd_all/issues/130) oder [AppImage](https://github.com/OCR-D/ocrd_all/issues/106) oder [Conda](https://github.com/OCR-D/core/issues/528) oder [bessere Kapselung von Systemabhängigkeiten](https://github.com/OCR-D/ocrd_all/issues/56): >2y... - Dokumentation: realistische Benutzung von Docker (https://github.com/OCR-D/ocrd-website/issues/98, https://github.com/OCR-D/ocrd-website/issues/247): >2y... - [Dokumentation: Modellverwaltung unter Docker](https://github.com/OCR-D/ocrd-website/issues/318): >8m... - **Dokumentation: Aktualisierung des Workflow-Guides** (https://github.com/OCR-D/ocrd-website/issues/104, https://github.com/OCR-D/ocrd-website/issues/172, https://github.com/OCR-D/ocrd-website/issues/174, https://github.com/OCR-D/ocrd-website/issues/268, https://github.com/OCR-D/ocrd-website/issues/297): >10m... - Dokumentation: Guide/Richtschnur Softwareentwicklung (https://github.com/OCR-D/ocrd-website/issues/119, https://github.com/OCR-D/ocrd-website/issues/112): >2y... ## Eigenanteil allein auf [OCR-D/*](https://github.com/OCR-D) seit 09/2020 – **hoch**: (nicht erfaßt: Anteile vor jeweiligem Transfer eines Repos nach `OCR-D/`!) - 253 PRs von 2324 → **11%** (außerdem eigene PRs ohne Releases!) - 347 Commits von 2067 → **17%** (außerdem eigene Commits meist umfangreicher!) - 343 PR-Reviews von 1260 → **27%** - 1700 Issues/PR-Kommentare von 6553 → **26%** (außerdem eigene Kommentare ohne CI!) Kommunikation auf [Gitter-Lobby](https://gitter.im/OCR-D/Lobby) seit 09/2020: - 284 Nachrichten von 1906 → **15%** (aber fast immer als Support/Antwort, selten Ankündigungen/Fragen) Mithilfe bei externen Repositories mit OCR-D-Bezug: - [cisocrgroup/ocrd_cis](https://github.com/cisocrgroup/ocrd_cis) - [hnesk/browse-ocrd](https://github.com/hnesk/browse-ocrd) - [UB-Mannheim/ocr-fileformat](https://github.com/UB-Mannheim/ocr-fileformat) - [UB-Mannheim/ocrd_pagetopdf](https://github.com/UB-Mannheim/ocrd_pagetopdf) - [kba/page-to-alto](https://github.com/kba/page-to-alto) - [kba/transkribus-to-prima](https://github.com/kba/transkribus-to-prima) - [qurator-spk/sbb_binarization](https://github.com/qurator-spk/sbb_binarization) - [Calamari-OCR/calamari](https://github.com/Calamari-OCR/calamari) - [tesseract-ocr/tesseract](https://github.com/tesseract-ocr/tesseract) - [tesseract-ocr/tesstrain](https://github.com/tesseract-ocr/tesstrain) - [PRImA-Research-Lab/*](https://github.com/PRImA-Research-Lab/) - [ocr-d-modul-2-segmentierung/*](https://github.com/ocr-d-modul-2-segmentierung/) - [OCR4all/LAREX](https://github.com/OCR4all/LAREX) - [jsbueno/pyleptonica](https://github.com/jsbueno/pyleptonica) - [sirfz/tesserocr](https://github.com/sirfz/tesserocr) - [githubharald/DeslantImg](https://github.com/githubharald/DeslantImg) - [kba/pylsd](https://github.com/kba/pylsd) eigene Repositories mit OCR-D-Bezug außerhalb Modulprojekt ([ASVLeipzig](https://github.com/ASVLeipzig)) / Implementierungsprojekt ([SLUB](https://github.com/slub)): - [workflow-configuration](https://github.com/bertsky/workflow-configuration) - [ocrd_detectron2](https://github.com/bertsky/ocrd_detectron2) - [ocrd_wrap](https://github.com/bertsky/ocrd_wrap) - [ocrd_doxa](https://github.com/bertsky/ocrd_doxa) - [ocrd_origami](https://github.com/bertsky/ocrd_origami) - [docstruct](https://github.com/bertsky/docstruct) - [nmalign](https://github.com/bertsky/nmalign) - [Mask_RCNN](https://github.com/bertsky/Mask_RCNN)