# Beispiele OCR-D-Entwicklung
(Stand: 30.11.2022)
## Aktuelle Issues und Pull-Requests
- Spezifikation:
https://github.com/OCR-D/spec/issues (35)
https://github.com/OCR-D/spec/pulls (8)
- Implementierung/Framework:
https://github.com/OCR-D/core/issues (78)
https://github.com/OCR-D/core/pulls (20)
- Deployment:
https://github.com/OCR-D/ocrd_all/issues (26)
https://github.com/OCR-D/ocrd_all/pulls (3)
- Dokumentation:
https://github.com/OCR-D/ocrd-website/issues (31)
https://github.com/OCR-D/ocrd-website/pulls (2)
- Testdaten/GT:
https://github.com/OCR-D/assets/issues (16)
https://github.com/OCR-D/assets/pulls (4)
## Dauer für Bugfixing
- [`--overwrite`](https://github.com/OCR-D/core/issues/825) und [`make_file_id`](https://github.com/OCR-D/core/pull/861): 6m
- [`--working-dir`](https://github.com/OCR-D/core/issues/693) und [`--mets-basename`](https://github.com/OCR-D/core/pull/696): 8m
- [Symlinks](https://github.com/OCR-D/core/issues/802): 9m
- [`ocrd-dummy`](https://github.com/OCR-D/core/pull/814): >9m...
- [`ocrd zip bag`](https://github.com/OCR-D/core/issues/363): >3y
## Dauer für neue Funktionalität
- Ressource-Manager, v.a. Dezentralisierung und Modul-Auslieferung (https://github.com/OCR-D/core/issues/689, https://github.com/OCR-D/core/issues/690, https://github.com/OCR-D/core/pull/797, https://github.com/OCR-D/core/issues/691, https://github.com/OCR-D/core/issues/750, https://github.com/OCR-D/core/issues/752, https://github.com/OCR-D/core/pull/753, https://github.com/OCR-D/core/pull/777, https://github.com/OCR-D/core/issues/780, https://github.com/OCR-D/core/pull/800, https://github.com/OCR-D/core/issues/801, https://github.com/OCR-D/core/pull/901, https://github.com/OCR-D/core/pull/904, https://github.com/OCR-D/core/issues/908, https://github.com/OCR-D/core/pull/909, https://github.com/OCR-D/core/issues/916, https://github.com/OCR-D/core/issues/924, https://github.com/OCR-D/core/pull/932, https://github.com/OCR-D/core/pull/933, https://github.com/OCR-D/core/pull/934, https://github.com/OCR-D/core/pull/939, https://github.com/OCR-D/core/pull/940, https://github.com/OCR-D/core/issues/930, https://github.com/OCR-D/spec/issues/193): 10m
- METS Caching (https://github.com/OCR-D/core/issues/723, https://github.com/OCR-D/core/pull/875, https://github.com/OCR-D/core/pull/944, https://github.com/OCR-D/core/pull/958): >12m
- [partielles Workspace-Klonen](https://github.com/OCR-D/core/pull/582): >2y...
- Speicherverbrauchmessung (https://github.com/OCR-D/core/issues/607 https://github.com/OCR-D/core/pull/878 https://github.com/OCR-D/core/pull/929): 1y
- [OcrdPage-Fehlerbehandlung](https://github.com/OCR-D/core/pull/576): >2y...
- [**Web-API-Spezifikation**](https://github.com/OCR-D/spec/pull/222): >1y...
- [**Processing-Server**](https://github.com/OCR-D/core/pull/884): >7m... (eigentlich: [Processing/Workflow-Server](https://github.com/OCR-D/core/pull/652) wartet seit >2y)
## Wartezeit für neue Funktionalität
- Softwarebibliothek für Zeichensätze, Transkriptionsregeln und Level-Umrechnung nach GT-Richtlinien zur Nutzung in OCR-Training: >1y...
- [selektive Prozessierung nach Kapiteln und Seitentyp](https://github.com/OCR-D/spec/issues/192): 10m...
- [Dewarping auf Seitenebene](https://github.com/OCR-D/spec/issues/180): >18m...
- [Spezifikation für Evaluator-CLI](https://github.com/OCR-D/spec/issues/172): >2y...
- [Spezifikation für logische Dokumentstruktur](https://github.com/OCR-D/spec/issues/142) und [Artikelstruktur](https://github.com/OCR-D/spec/issues/40): >2y...
- [CMYK-Unterstützung](https://github.com/OCR-D/core/issues/656): 2y...
- [JPEG2000- und JBIG2-Unterstützung](https://github.com/OCR-D/core/issues/526): >2y...
- [Unterstützung für Bildwinkel-Metadaten](https://github.com/OCR-D/core/issues/494): >2y...
- [**Aufrechterhalten der DPI-Metadaten**](https://github.com/OCR-D/core/issues/343): >3y...
- [**Aufrechterhalten der File-URLs in METS**](https://github.com/OCR-D/core/issues/323): >3y...
- [fileGrp-Klonen](https://github.com/OCR-D/core/issues/634): 2y...
- [erweiterte PAGE-Validierung](https://github.com/OCR-D/core/issues/740): 1y...
- [partielle Validierung](https://github.com/OCR-D/core/issues/383): >3y...
- [**Erlauben von Dateien, die das gesamte Werk repräsentieren, während der Validierung**](https://github.com/OCR-D/core/issues/485): >2y...
- [automatische Validierung](https://github.com/OCR-D/core/issues/555) und [generische Konfigurationsmechanismen](https://github.com/OCR-D/core/issues/376#issuecomment-562349028): >2y...
- [**METS-Finalisierung/Bereinigung**](https://github.com/OCR-D/core/issues/544): 2y...
- [**API-Änderungen für Parallelverarbeitung und Fehlerbehandlung**](https://github.com/OCR-D/core/issues/322): >3y...
- [**Deployment: isolierte Modul-Container**](https://github.com/OCR-D/ocrd_all/issues/69): >2y...
- [**Deployment: automatische, realistische Regressionstests**](https://github.com/OCR-D/ocrd_all/issues/112): >2y...
- [Deployment: Debian/Ubuntu-Pakete](https://github.com/OCR-D/ocrd_all/issues/130) oder [AppImage](https://github.com/OCR-D/ocrd_all/issues/106) oder [Conda](https://github.com/OCR-D/core/issues/528) oder [bessere Kapselung von Systemabhängigkeiten](https://github.com/OCR-D/ocrd_all/issues/56): >2y...
- Dokumentation: realistische Benutzung von Docker (https://github.com/OCR-D/ocrd-website/issues/98, https://github.com/OCR-D/ocrd-website/issues/247): >2y...
- [Dokumentation: Modellverwaltung unter Docker](https://github.com/OCR-D/ocrd-website/issues/318): >8m...
- **Dokumentation: Aktualisierung des Workflow-Guides** (https://github.com/OCR-D/ocrd-website/issues/104, https://github.com/OCR-D/ocrd-website/issues/172, https://github.com/OCR-D/ocrd-website/issues/174, https://github.com/OCR-D/ocrd-website/issues/268, https://github.com/OCR-D/ocrd-website/issues/297): >10m...
- Dokumentation: Guide/Richtschnur Softwareentwicklung (https://github.com/OCR-D/ocrd-website/issues/119, https://github.com/OCR-D/ocrd-website/issues/112): >2y...
## Eigenanteil
allein auf [OCR-D/*](https://github.com/OCR-D) seit 09/2020 – **hoch**:
(nicht erfaßt: Anteile vor jeweiligem Transfer eines Repos nach `OCR-D/`!)
- 253 PRs von 2324 → **11%**
(außerdem eigene PRs ohne Releases!)
- 347 Commits von 2067 → **17%**
(außerdem eigene Commits meist umfangreicher!)
- 343 PR-Reviews von 1260 → **27%**
- 1700 Issues/PR-Kommentare von 6553 → **26%**
(außerdem eigene Kommentare ohne CI!)
Kommunikation auf [Gitter-Lobby](https://gitter.im/OCR-D/Lobby) seit 09/2020:
- 284 Nachrichten von 1906 → **15%**
(aber fast immer als Support/Antwort, selten Ankündigungen/Fragen)
Mithilfe bei externen Repositories mit OCR-D-Bezug:
- [cisocrgroup/ocrd_cis](https://github.com/cisocrgroup/ocrd_cis)
- [hnesk/browse-ocrd](https://github.com/hnesk/browse-ocrd)
- [UB-Mannheim/ocr-fileformat](https://github.com/UB-Mannheim/ocr-fileformat)
- [UB-Mannheim/ocrd_pagetopdf](https://github.com/UB-Mannheim/ocrd_pagetopdf)
- [kba/page-to-alto](https://github.com/kba/page-to-alto)
- [kba/transkribus-to-prima](https://github.com/kba/transkribus-to-prima)
- [qurator-spk/sbb_binarization](https://github.com/qurator-spk/sbb_binarization)
- [Calamari-OCR/calamari](https://github.com/Calamari-OCR/calamari)
- [tesseract-ocr/tesseract](https://github.com/tesseract-ocr/tesseract)
- [tesseract-ocr/tesstrain](https://github.com/tesseract-ocr/tesstrain)
- [PRImA-Research-Lab/*](https://github.com/PRImA-Research-Lab/)
- [ocr-d-modul-2-segmentierung/*](https://github.com/ocr-d-modul-2-segmentierung/)
- [OCR4all/LAREX](https://github.com/OCR4all/LAREX)
- [jsbueno/pyleptonica](https://github.com/jsbueno/pyleptonica)
- [sirfz/tesserocr](https://github.com/sirfz/tesserocr)
- [githubharald/DeslantImg](https://github.com/githubharald/DeslantImg)
- [kba/pylsd](https://github.com/kba/pylsd)
eigene Repositories mit OCR-D-Bezug außerhalb Modulprojekt ([ASVLeipzig](https://github.com/ASVLeipzig)) / Implementierungsprojekt ([SLUB](https://github.com/slub)):
- [workflow-configuration](https://github.com/bertsky/workflow-configuration)
- [ocrd_detectron2](https://github.com/bertsky/ocrd_detectron2)
- [ocrd_wrap](https://github.com/bertsky/ocrd_wrap)
- [ocrd_doxa](https://github.com/bertsky/ocrd_doxa)
- [ocrd_origami](https://github.com/bertsky/ocrd_origami)
- [docstruct](https://github.com/bertsky/docstruct)
- [nmalign](https://github.com/bertsky/nmalign)
- [Mask_RCNN](https://github.com/bertsky/Mask_RCNN)