or
or
By clicking below, you agree to our terms of service.
New to HackMD? Sign up
Syntax | Example | Reference | |
---|---|---|---|
# Header | Header | 基本排版 | |
- Unordered List |
|
||
1. Ordered List |
|
||
- [ ] Todo List |
|
||
> Blockquote | Blockquote |
||
**Bold font** | Bold font | ||
*Italics font* | Italics font | ||
~~Strikethrough~~ | |||
19^th^ | 19th | ||
H~2~O | H2O | ||
++Inserted text++ | Inserted text | ||
==Marked text== | Marked text | ||
[link text](https:// "title") | Link | ||
 | Image | ||
`Code` | Code |
在筆記中貼入程式碼 | |
```javascript var i = 0; ``` |
|
||
:smile: | ![]() |
Emoji list | |
{%youtube youtube_id %} | Externals | ||
$L^aT_eX$ | LaTeX | ||
:::info This is a alert area. ::: |
This is a alert area. |
On a scale of 0-10, how likely is it that you would recommend HackMD to your friends, family or business associates?
Please give us some advice and help us improve HackMD.
Do you want to remove this version name and description?
Syncing
xxxxxxxxxx
Robuste und performante Verfahren für die Layoutanalyse in OCR-D
Beitrag SLUB
(Arbeitstreffen)
Robert Sachunsky
26.11.2024 : https://hackmd.io/@bertsky/ocrd-layout-meeting
Status
1 Fortschritt OCR-D (allgemein)
skip|abort|overwrite|copy
) und Timeouts auf Prozessor-/SeitenebeneMultithreadingMultiprocessing1 Fortschritt OCR-D (allgemein)
1 Fortschritt OCR-D (allgemein)
1 Fortschritt OCR-D (allgemein)
(auch: TF 2.15 und Calamari 2.x)
2 Fortschritt OCR-D (effizientes GPU-Pipelining)
Vorbild: tfaip,tfx.serving
AsyncPredictor
2 Fortschritt OCR-D (effizientes GPU-Pipelining)
– peaky, low util. to avoid OOM
2 Fortschritt OCR-D (effizientes GPU-Pipelining)
– peaky
2 Fortschritt OCR-D (effizientes GPU-Pipelining)
– peaky
2 Fortschritt OCR-D (effizientes GPU-Pipelining)
predict_pipeline
, batch bucketing– peaky
2 Fortschritt OCR-D (effizientes GPU-Pipelining)
predict_pipeline
, batch bucketing– less peaky
2 Fortschritt OCR-D (effizientes GPU-Pipelining)
predict_on_batch
, batch bucketing– even less peaky
2 Fortschritt OCR-D (effizientes GPU-Pipelining)
mp.Queue
-based generator– smooth!
3 Fortschritt Detectron2
- The image file may be corrupted
- The server hosting the image is unavailable
- The image path is incorrect
- The image format is not supported
Learn More →– Panoptic braucht zusätzliche Daten(konversion)
3 Fortschritt Detectron2
Baukasten: Segmentierung
Baukasten: Evaluierung
pycocotools.cocoeval
partielle Quellen, Doku, Zusage von C. Clausner zur Mithilfe
Diskussion Struktur-GT
Diskussion Struktur-GT
→ zu homogen/modern
Ideen SLUB (1)
ocrd-segment: Template-basierte Analyse, Notebook von @hnesk
eigene(s) Detectron2-Modell(e) für Regionen
(Mask-RCNN Panoptic; evtl. Spezialmodelle)
eigenes Kraken-Modell für Zeilen
(aber Handschrift und Print in allen Varianten; nur auf Regionen-Ebene, damit robust und modular)
Ideen SLUB (2)
→ Arbeit an GT mit OCR-Workflows
→ dynamische Qualitätsabschätzung ohne GT
Ideen SLUB (3)
Ziele
Planung
Planung