# OCR4All Train the Trainer
## Ablauf - Organisatorisches
- Informtikgebäude: https://www.mathematik-informatik.uni-wuerzburg.de/sonstiges/anfahrt-und-lageplan/fakultaet-fuer-mathematik-und-informatik/informatikgebaeude/
- Besprechungsraum B002 (Erdgeschoss), ansonsten einfach anrufen
- Ideale Busverbindung: Linie 14, Haltestelle Mathematisches Institut, dann über die Straße und Schleichweg folgen, anschließend in das hässlichste Gebäude gehen
- Wenn man von dieser Haltestelle kommt, geht man von hinten/unten ins Gebäude; das Erdgeschoss ist dann eine Etage drüber.
- Wann dürfen die Teilnehmer anreisen? [Das weiß ich nicht, reise am Tag vorher an, um noch andere Dinge in der Stadt zu klären MD]
- Wann findet die eigentliche Veranstaltung statt? (Annahme FL Freitag 9.8 9-16/17 Uhr [Meine Annahme auch MD])
- Wie schnell ist der HBF zu erreichen? [Reine Busfahrzeit ca. 20 min MD]
- Hat jemand Interesse nach dem Ende des Programms gemeinsam Abendzuessen bzw. die Veranstaltung ausklingen zu lassen? [Wahlweise Anreise am Donnerstag vorher, daß man sich in einer Restauration trifft oder sehr späte Abreise am Freitagabend, bin für beides zu haben MD]
=> Wir könnten derzeit noch Fahrkarten zum Sparpreis buchen!
Termin Tel-Konferenz: 21.07. 10.00 Uhr
– Noch weitere Leute anwerben?
_Interessierte ansprechen und nicht aktiv missionieren, sondern erst einmal Erfahrungen mit jetzt potentiellen Trainern sammeln. (Dahnke)_
– Was stellt ihr euch vor?
_Für 09.08.2019 Zweiteilung des Tages: 1. Vorstellung letzter Aktualisierungen, wie werden Aktualisierungen zukünftig überhaupt kommunziert? 2. Fragen der Trainer/Nutzer beantworten? (Dahnke)_
– Default Workshop durchspielen und wichtige Punkte besprechen?
_Einerseits interessant, Euer Konzept zu erfahren, andererseits finde ich das unter obigem »Was stellt ihr euch vor?« Notierte auch wichtig. Durchspielung des Default Workshop an zweitem Tag in Würzburg oder per mehrstündiger Videokonf.? (Dahnke)_
– Gemeinsamer Foliengrundstock sinnvoll?
_Ja, und möglichst nicht verpflichtend, gemeinsames Logo und Corporate Design für Produkt vielleicht hilfreich. (Dahnke)_
– Meinung der Trainer auch in Planungen bzgl. Entwicklung einbeziehen.
_Ja. (Dahnke)_
– Zielgruppenproblematik.
– Wiki optimieren.
- Klientel an eurem Standort / in euren Workshops?
- Mit welchen Daten bekommt ihr es zu tun -> vorab zukommen lassen und dass als Diskussionsgrundlage in WOrkshop mit einfließen lassen.
- Trainer sollten Kompetenzen haben für verschiedenste Materialien (auch eher nicht geeignete) und sollten Nutzen/Aufwände einschätzen können.
- Vorab Pool erstellen, über den auf Workshop konkret gesprochen werden kann.
- Evtl. Cloud, Werke reinladen mir kurzer Beschreibung.
- Bereits konkretes Interesse von Nutzern -> Material? _Zeitungs-OCR (Dahnke) Material dafür bereitstellen?_
- Clustern nach Merkmalen wie Typographie und Layout.
## Anmerkungen - Verbesserungsvorschläge
Anfang Anmerkungen FL
GT-Erstellung: Zustände für Zeilen => Weiß=Unbearbeitet Grün=GT Vorschlag: Gelb=Unsicher Rot=Fehler/Unbrauchbar/ausgeschlossen
Benutzerverwaltung / Pakete => Würde vereinfachtes kollaboratives Arbeiten ermöglichen
Hin und Herverschieben der GT Zeilen => Lange zeilen ragen aus dem dargestellten Fenster und können nicht korrigiert werden
Einbau Auswahlmöglichkeit von Kraken Segment: https://github.com/wrznr/column-detect, Durch das Baukastenprinziep von Ocropus wäre eine Integration von Kraken Segment möglich
Einbau einer Kommandozeilenfunktion: Würde das direkte eingreifen mit Befehlen ermöglichen
Springen mit den Pfeiltasten nach unten => Zwiespältiger Vorschlage, Tab Lösung ist besser
Sonderzeichen sind auf der Tastatur nicht anlegbar => Beim Einfügen von Sonderzeichen mit Strg+V in das Einfügen Textfeld wird nur das nicht zusammengesetzte (eindimensionale) Unicode Zeichen eingefügt
Fehlermeldungen => Es kommt manchmal zu Fehlermeldungen wo lediglich der Status Failed ausgegeben wird und der Arbeitsprozess einfach abbricht. Bedauerlicherweise erlaubt diese Ausgabe keinerlei Rükschlüsse auf die eignetliche Ursache für dieses Verhalten
Sitzungen stürtzen ab => Vielleicht wäre es hilfreich standartmäßig einen log-Ordner im Docker-Container zu mounten, in dem die Ausgaben der Konsole festgehalten werden
Benennen von Modellen: Zur Unterrscheidung der trainierten Modelle würde es Helfen wenn man ein paar Notizen zu den Modellen abspeichern könnten. Außerdem wäre super, wenn die Paramter mit denen ein Modell erzeugt wurde abgespeichert würden.
Wünschen darf man sich viel... ;-) : Es wäre genial wenn es direkt ein angeschlossenenes Werkzeug/ eine Nachkorrekturoption gäbe, die ein Auszeichnen einzelner Wörter bzw. Zeichenketten ermöglichen würde. Die Möglichkeit bei der GT-Erzeugung gleichzeitig zu annotieren würde zwei Arbeitsschritte verschmelzen... Das ganze ist ++NUR++ ein Gedankenspiel.... Wäre womöglich eine Zusammenarbeit mit PoCoWeb/PoCoTo sinnvoll? Ich kann nur noch einmal hervorheben das OCR4ALL eine sehr große Hilfe ist!
Neu 15.7:
Beim Klicken auf Projekt-Overview wird zunächst der Punkt Projektauswahl expandiert und dann automatisch wieder eingeklappt. Um ihn erneut zu expandieren muss er wieder ausgeklappt und dann ein Projekt ausgewählt werden. Vielleicht könnte man das automatische Einklappen abschalten.
Ende Anmerkungen FL
_Wann letzte Veröffentlichung? Wie am einfachsten Aktualisierung? (Dahnke)_
Anmerkung JG 8.8.19: Versionsnummer nach Möglicheit auf die Startseite