[Workshop „Scholarly Makerspaces – Bibliotheken als Vermittlungsplattform für Digital-Humanities-Tools“ am 27.02.2019](https://blogs.hu-berlin.de/furesh/2019/01/30/workshop-scholarly-makerspaces-bibliotheken-als-vermittlungsplattform-fuer-digital-humanities-tools-am-27-02-2019/)
===
# [Christian Thomas](http://www.bbaw.de/die-akademie/mitarbeiter/thomas): CLARIN-D/CLARIAH-DE -- „Digital-Humanities-Tools“ und weitere Angebote für „Scholarly Makerspaces“ in Bibliotheken
![Die Forschungsumgebung DTA](http://kaskade.dwds.de/~haaf/img/ForschungsplattformDTA.png "Abb. aus: Alexander Geyken, Matthias Boenig, Susanne Haaf, Bryan Jurish, Christian Thomas, Frank Wiegand: Das Deutsche Textarchiv als Forschungsplattform für historische Daten in CLARIN. In: Henning Lobin, Roman Schneider, Andreas Witt (Hgg.): Digitale Infrastrukturen für die germanistische Forschung (= Germanistische Sprachwissenschaft um 2020, Bd. 6). Berlin/Boston, 2018, S. 219–248. DOI: 10.1515/9783110538663-011.")
*Das Deutsche Textarchiv als Forschungsplattform; Abb. aus: Geyken et al. 2018, S. 221 (siehe dazu die Literaturhinweise in den Anmerkungen).*
## Abstract
Das Zentrum Sprache der [Berlin-Brandenburgischen Akademie der Wissenschaften (BBAW)](http://www.bbaw.de/) beherbergt eines von deutschlandweit acht Servicezentren in [CLARIN-D](https://www.clarin-d.net/), dem deutschen Partner des europäischen CLARIN ERIC.[^clarin] Als Teil dieser Infrastruktur an der BBAW wird das [*Deutsche Textarchiv* (DTA)](http://www.deutschestextarchiv.de/)[^dta] betrieben, in dem historische Drucke und Manuskripte des 17. bis 19. bzw. frühen 20. Jahrhunderts in einem einheitlichen Auszeichnungsformat aufbereitet werden. Dabei kommen sowohl DTA-eigene als auch -externe Textressourcen als Erweiterungen des Korpus in Frage, sofern sie den qualitativen und formatspezifischen Anforderungen des DTA entsprechen bzw. mit vertretbarem Aufwand auf dieses Level hin aufgewertet werden können (Stichwort Datenkuration/Digital Curation[^digitalcuration]). Dazu bietet das DTA bzw. CLARIN-D eine Vielzahl von Handreichungen sowie umfangreichen diskursiven und technischen Hilfsmitteln an, die es auch Nicht-Experten ermöglichen, qualitativ hochwertige, standardkonforme und somit (potentiell) interoperable Textressourcen zu erstellen -- und diese auf Wunsch auch im DTA zu veröffentlichen. Daran anschließend bieten sich eine Vielzahl weiterer Annotations- und Analysemöglichkeiten sowohl auf der DTA-Seite selbst als auch innerhalb angebundener sog. Digital-Humanities-Tools.
Die DTA- bzw. CLARIN-D-Infrastruktur unterstützt auf diese Weise fachwissenschaftliche Nutzerinnen und Nutzer auf dem gesamten Weg durch den 'Data Life Cycle'[^DataLifeCycle]: Von der Metadaten- und Text-Erfassung (manuell, semi-automatisch, automatisch) über die strukturelle wie semantische Annoation, die Einbindung von Normdaten und Vokabularen, die computerlinguistische Analyse und darauf basierende Visualisierungen und Explorationsmöglichkeiten bis hin zur Herstellung der Langzeitverfügbarkeit und -archivierung der Dokumente. Somit steht ein umfassendes Angebot bereit, das auch im Rahmen sog. „Scholarly Makerspaces“ in Bibliotheken vermittelnd, sensibilisierend und schulend eingesetzt werden kann und sollte. Der Vortrag setzt einige Schlaglichter und versucht, eine klare Rollenverteilung zwischen Bibliothek und Forschungs(daten)infrastruktur zu entwerfen.
[^clarin]: CLARIN-D = Common Language Resources and Technology Infrastructure Deutschland; ERIC = European Research Infrastructure Consortium; zu CLARIN-D vgl. https://www.clarin-d.net/; zum CLARIN ERIC https://www.clarin.eu/ (alle URLs in diesem Abstract zuletzt abgerufen am 25.01.2019).
[^dta]: *Deutsches Textarchiv*. Grundlage für ein Referenzkorpus der neuhochdeutschen Sprache. Herausgegeben von der Berlin-Brandenburgischen Akademie der Wissenschaften, Berlin 2019. URL: http://www.deutschestextarchiv.de/. Vgl. dazu z.B. Alexander Geyken, Matthias Boenig, Susanne Haaf, Bryan Jurish, Christian Thomas, Frank Wiegand: „Das Deutsche Textarchiv als Forschungsplattform für historische Daten in CLARIN.“ In: Henning Lobin, Roman Schneider, Andreas Witt (Hgg.): *Digitale Infrastrukturen für die germanistische Forschung* (= Germanistische Sprachwissenschaft um 2020, Bd. 6). Berlin/Boston, 2018, S. 219–248. Online-Version, DOI: [10.1515/9783110538663-011](https://doi.org/10.1515/9783110538663-011); Frank Wiegand, Christian Thomas, Susanne Haaf, Alexander Geyken, Bryan Jurish, Matthias Boenig: „Recherchieren, Arbeiten und Publizieren im Deutschen Textarchiv: ein Praxisbericht.“ In: *Zeitschrift für Germanistische Linguistik* 46.1 (2018), S. 147–161. DOI: [10.1515/zgl-2018-0009](https://doi.org/10.1515/zgl-2018-0009).
[^digitalcuration]: Zu Datenkuration bzw. Digital Curation und deren Grundbegriffen im hier relevanten Kontext vgl. z. B. Digital Curation Centre (DCC): ["DCC Charter and Statement of Principles"](http://www.dcc.ac.uk/about-us/dcc-charter/dcc-charter-and-statement-principles); speziell im Kontext von DTA und CLARIN-D siehe Christian Thomas, Frank Wiegand: "Making great work even better. Appraisal and digital curation of widely dispersed electronic textual resources (c. 15th–19th centuries) in CLARIN-D."" In: Gippert, Jost / Gehrke, Ralf (Hrsg.): *Historical Corpora. Challenges and Perspectives.* Tübingen 2015, S. 181–196. \[[Frei verfügbar als zitierfähige Druckfassung im PDF-Format](http://www.deutschestextarchiv.de/files/Thomas-Wiegand-2015_Making-Great-Work-Even-Better_CLIP-5_2018-07-05.pdf).\]
[^DataLifeCycle]: Sog. (Research) Data (Management) Lifecycle wurden in verschiedenen Versionen mit jeweils unterschiedlichen Schwerpunkten und Detailgraden beschrieben, vgl. z. B. den ["Research Data Management Lifecycle"](https://guides.library.ucsc.edu/datamanagement) der University of California Santa Cruz University Library; vgl. dazu im Kontext des hier umrissenen Vortrags auch das ["DCC Curation Lifecycle Model"](http://www.dcc.ac.uk/resources/curation-lifecycle-model) des [Digital Curation Centre (DCC)](http://www.dcc.ac.uk).