---
tags: Werknormdaten
---
# GND-Workshop Notizen
* Screenshots von Concept-Board sind auf dem FP-Server abgelegt
## Begrüßung
* auch weitere Veranstaltungen geplant weil Forum v.a. Vernetzung der Teilnehmer dienen soll
* Umfrage tool menti.com
* Folien und Zusammenfassung der Vorträge werden Ende Juni auf der text+-Seite publiziert
## Jürgen Kett: GND x NFDI: Über das Verschränken von Datennetzwerken und Communities
* text+ soll GND-Daten mit Gesamt-NFDI und letztlich Web verknüpfen
* GND nicht als Datenpool für Forschungsdaten sondern als Brückenoption zu anderen Datensätzen und Communities
* Entitäten der GND: Personen 61 %, Körperschaften 18%, Kongresse 9%, dann erst Werke mit 5%
* bisher nur 5% der GND-Daten Werke weil bisher nicht gemacht
* soll erst noch abgeklärt werden an welchen Stellen Werke sinnvoll und wo Redundanz zu Bibliothekskatalogen
* Anzahl an Werknormdatensätzen könnte in nächsten Jahren stark ansteigen und sogar Spitzenreiter werden
* GND bisher v.a. von Bib + Archiven in DACH-Raum genutzt
* Forschungsdaten bisher v.a. aus DH-Bereich schon eingebunden
* neben Sammlungen / Beständen und Forschungsdaten Mappings zu Wissenssystemen & Thesauri (zB ORCID, Wikidata etc)
* Verknüpfungen zu und aus GND auch sehr wichtig als Verbindungen zu anderen Systemen
* Bedarf / Relevanz für neue Daten entscheiden Communities - Erstellung von Daten ist mit Verpflichtung und Verantwortung der Pflege der Daten verbunden
* Anforderungen aus der Community entwickeln, nicht top down (Datenbasis, Mappings, Regeln & Ontologie, Tools, Schnittstellen & Formate)
* Wie läuft das genau ab?
* mit SUB Göttingen soll GND-Agentur für text+ aufgebaut werden
* einfache Workflows/Möglichkeiten für Ergänzungen in text+ sollen erarbeitet werden
* Schnittstellen/APIs in andere Systeme/Infrastrukturen sollen ggf. ergänzt werden damit GND in NFDI sehr gut nutzbar
* Normdaten-Inkubator: Vorschlagsraum sodass lokale Normdaten auch leicht von anderen genutzt werden können, soll Schwelle/Hürden für Eingabe von Normdaten senken
* aus Vorschlag kann ggf. (semi-)automatisch ein echter Eintrag erstellt werden; würde voraussetzen dass Forscher entsprechende Expertise in Erstellung von GND-Datensätzen aufbauen
## Harald Lordick, Uwe Sikora: Die GND in der Anwendung am Beispiel ausgewählter Editionsprojekte und Vernetzungspotenziale und -initiativen
* zu verknüpfende Entitäten über Normdatendienste o.ä. identifiziert
* soll dafür dienen Register/Netzwerke etc. zu erstellen und Forschungsfragen stellen und beantworten zu können
* in Editionen TEI P5 als Standard für Auszeichnung von Entitäten (tei:name, tei:ref)
* am einfachsten direkt dnb-URI in Daten zu verlinken
* außerdem indirekt möglich indem ID von interner Datenbank verlinkt (z.B. aus textgrid); so können auch weitere Infos angegeben werden
* indirekt auch einfacher möglich über Surrogat (Zwischenformat) sodass projektspezifische Infos ebenfalls eingebunden werden können; wichtig falls in Projekten Forschungsdaten bereitgestellt werden müssen; die Surrogat-Formate dienen der Dokumenation für die später notwendige Publikation von Forschungsdaten
* BEACON-Dateien erlauben Vernetzung
* Dateien scheinen sehr einfach aber ex gibt auch komplexe Spezifikation
* Wiki-Data nutzt auch intensiv BEACON-Dateien
* beaconfinder von MWW (Daniela Schulz hat H. Lordick darauf hingewiesen)
* aktuell hauptsächlich Personennormdaten
* ZFDG nutzt schon GND-Annotationen für eigene Publikationen
* Bsp. für BEACON Steinheim Insitut STI Linked Data Service - domänenspezifische Perspektive
* http://www.steinheim-institut.de/see-also/query.html?text1=116176288&kategorie1=GND
* Normdatenbasierte Vernetzung/Infrastruktur ermöglicht sodass andere Angebote entlastet
* wenn noch mit OCR/Volltexten verbunden dann können auch Volltextsuchen effektiver werden weil mit Datensatz verbundene weitere Begriffe ebenfalls gefunden werden können
* Daten werden dadurch auch FAIRer
* Datenqualität wird verbessert + Daten auch semantisch besser aufbereitet
* nicht tiefe sondern v.a. viele Entitäten benötigt
* wichtig dass man an GND aktiv mitarbeiten/eigene Ideen einbringen kann
* Identifikation von Entitäten steht bei Normdaten(-diensten) im Fokus damit von anderen gut nachgenutzt werden kann (andere im Sinne von maschinenlesbar + damit klar welche Person etc. genau gemeint ist (z.B. welcher Hegel etc.))
* GND Webformular
* Wie geht man mit Unsicherheiten bei der Identifikation und Forschungskontroversen um?
* anwendungsbezogene Lösungsverfahren in TEI etc. sodass genauer (Un-)Sicherheitsstatus beschrieben werden kann
* unterschiedliche Optionen dokumentieren
* letztlich Evaluierungsmechanismus möglich damit verschiedene Optionen bewertet werden können
==> ich (TK) finde die Frage noch nicht ausreichend beantwortet
<=> ich (EE) eigentlich schon: man schreibt alle Möglichkeiten hin und wie sicher man sich dabei ist; dann können ggf. andere entscheiden was "richtig" ist. wobei das genaue Verfahren natürlich recht projekt-/situationsabhängig ist
* alle möglichen Entitäten sollen mit Normdaten verknüpft werden (unbhängig davon ob es bereits einen Normdatensatz gibt oder er erst noch angelegt werden muss)
## Breakout 1: Wozu Normdaten? Welche Nutzenpotenziale ermöglichen sie?
* [Conceptboard](https://app.conceptboard.com/board/47kx-scdn-54zs-6t41-k345)
* TK in Gruppe A (aus den Postits)
* internationale Mappings zwischen Konzepten nutzen (Kett)
* Qualitätskontrolle in eigenen Datenbeständen (Michael Markert)
* Erstellen semantischer Netze zwischen Sammlungen/Ressourcen (Kett)
* wissenschaftliche Leistungen eindeutig zuordnen
* Unterstützung von Mehrsprachigkeit
* Disambiguierung von wiss. Informationen
* EE in [Gruppe B](https://app.conceptboard.com/board/47kx-scdn-54zs-6t41-k345#)
* Herausforderung viele Fachinfos auf kleine/knappe DNB-Datensätze herunterzubrechen
* niedrigschwelliger Zugang zu GND (bspw. über Webformular) wichtig
* Disambiguierung von Infos sehr schwierig ("korrekte" Identifikation von Personen)
* Metadaten für Forschungsdaten mit eindeutiger ID wichtig um so auch Qualität der Metadaten zu steigern
* Inwieweit Konzept der Normdaten in Forschung schon etabliert/verstanden?
* in Altertumswissenschaften ist Mangel an DNB-Daten problematisch
* Datenqualität der DNB-Angaben teils sehr schlecht sodass Verknüpfung mit eigenen Publikationen/Forschung gar nicht erwünscht weil nicht wissenschaftlich genug
* großer Bedarf die selbst erstellten guten Daten in DNB einzuspielen
* Vorteile/Potentiale von Normdaten?
* Pflege eigener Daten(-banken) immer schwierig; eigentlich einfacher wenn zentraler DNB-Datensatz genutzt werden kann sodass nur einmal Daten gepflegt werden müssen
* bei Normdaten immer wieder Dublikate was Arbeit damit erschwert <=> in letzten Jahren wohl besser geworden
* Sucheinstiege ermöglicht die es sonst nicht gäbe (z.B. über Personen-ID)
* eigene wissenschaftliche Arbeiten sichtbarer gemacht über ORCID-iD
* LOD schon in vielen Projekten genutzt sodass Daten weniger redundant erfasst werden müssen
* inwieweit FAIR Prinzipien für Normdaten relevant?
* erstmal Identifikation im Vordergrund
## Hauke Bartels & Marcin Szczepański: Das Potenzial der GND für sorbische Sprachressourcen. Eigennamen als Datenbestand und Schlüssel zu Texten
* Thema: lexikalische Ressouren - Wörterbücher / Mehrsprachigkeit
* vorhandene Sprachdaten wie Wörterbücher sollen stärker vernetzt werden wofür ggf. GND nützlich sein könnte
* dafür Daten nach Vernetzungspotential kategorisiert
* Rechtschreibung und Aussprache eher nicht für Vernetzung geeignet
* Identifikation schon über interne/eigene Nummern; Aussprache sehr individuell sodass nicht genormt möglich/sinnvoll
* Vernetzung sehr anspruchsvoll bei lexikografischen/lexikalischen Daten
* Vernetzung bei einzelnen Datenaspekten interessant bei TEI-annotierten Textkorpora + digitaler Bibliothek
* Entitäten wie Werke, Autoren, Themen etc. könnten vernetzt werden
* Vernetzung sehr sinnvoll bei Namen/Namensservices zu Personen + Orten
* Daten schon verbunden mit internen und externen Datensätzen/Ressourcen wie Wikidata
* Datenbank soll so umgebaut werden dass auch per API leicht abgefragt werden kann (mit SPARQL o.ä.)
* Koordination für laufende Projekte: welche Datenbestände werden lokal bearbeitet, welche gehen direkt in die GND
* niedersorbische digitale Bibliothek als Korpustexte mit TEI
* viele verschiedene Entitäten benötigt
* Zugang soll nicht nur über sorbische sondern auch über deutsche Sprache möglich sein (Stichwort Mehrsprachigkeit und GND), Ziel Zugang zu sorbischer Literatur für nichtsorbisch Sprechende erleichtern
* Schwerpunkt bei Identifikation nicht nur bei Metadaten sondern v.a. auch innerhalb von Texten
* Flektionen/Schreibvarianten müssen berücksichtigt werden weshalb Normdaten besonders interessant
* Herausforderung Namensvarianten (in diesem Fall Besonderheit der sorbischen Sprache) - drei Ebenen: Flexionsformen, Schreibvarianten, Mehrsprachigkeit
* neben textuellen Ressourcen auch nicht-textuelle Ressourcen wichtig; dafür gerade Register aufgebaut wofür auch Normdaten genutzt werden sollen
* sorbische Namen auch als Teil des Kulturerbes angesehen
## Breakout 2: Um welche konkreten Bedarfe geht es? In den Datendomänen? In anderen Kontexten?
* TK in Gruppe B
* Frage nach Problemen mit der Datenqualität (Doubletten etc.). Wie sind die Verfahren / Worksflows?
* Agenturen wichtig
* per email nicht möglich
* innerhalb der GND Worksflows, wenn man selbst keine Berechtigung hat
* Wieviele Agenturen gibt es?
* Agenturen verantworten prinzipiell alle Entitäten, Agenturen organisieren Aufteilung selbst
* Personen
* hier gibt es ein Formular für Veränderungen
* mit GND Explorer verbessert: Wer zuständig
* Bsp: https://explore.gnd.network/gnd/1179997255
* die zuständigen Institutionen müssen Änderungen vornehmen
* Einträge müssen Beiträger enthalten -> Qualitätssicherung
* Welcher Bedarf?
* Claus Zinn: Repositorium, früher nur strings, mittlerweile GND Normdaten (teilweise auch VIAF)
* hierbei aufgefallen, dass Personen doppelt vorhanden
* gut war, dass Personen schon vorhanden waren
* Herausforderung: Personen mit weit verbreiteten Namen, Bsp. Thomas Müller
* Wie funktioniert die Suche nach Identifier?
* liefert nicht reproduzierbare Ergebnisse
* Bsp.: https://portal.dnb.de/opac/simpleSearch?query=per%3D%22Einstein%22
* ergibt kein Ergebnis
* andere Variante
* https://portal.dnb.de/opac/simpleSearch?query=Albert+Einstein&cqlMode=true
* Lösung noch offen
* https://gnd.network/Webs/gnd/DE/Entdecken/entdecken_node.html
* Wie ist das Selbstverständnis der GND gegenüber Services?
* Interesse mehr Services anbzubieten? Oder Fokus auf Daten?
* GND ist eine Kooperative! Träger Bibliotheksverbünde
* EE in Gruppe C
* CARE-Arbeit benötigt viele Ressourcen weshalb auch Anzahl und Granularität von Daten vor/bei Anlegen von Normdaten bedacht werden sollte
* Mehrsprachigkeit ist wichtige Anforderung für GND; über Konkordanzen zu anderen Normdatendiensten wird bereits versucht Mehrsprachigkeit herzustellen; in GND auch Schweiz mit dabei sodass großer Bedarf nach mehrsprachigen Daten; Allgemeinbegriffe in GND mit Wikidata verlinkt sodass erste Mehrsprachigkeit da
* verschiedene Communities dürfen künftig eigene Vorzugsbenennungen einstellen sodass Bedarfe/Anforderunge von verschiedenen Communities berücksichtigt werden können
* GND kann auch eher flach bleiben und stattdessen stärker auf LOD setzen; also eigene Datenbanken aufbauen die die GND unterstützen/erweitern sodass auch Eigenheit der Geisteswissenschaft gestärkt dass oft keine eindeutigen Aussagen/Zuweisungen möglich
* Unsicherheiten lassen sich über schlanke GND und externe zusätzliche Daten besser modellieren
* dann klare Absprachen zwischen externen Datenlieferanten und GND nötig was in GND rein/was nicht + was existiert + wie organisiert etc.; dafür jetzt GND-Agenturen aufgebaut
* v.a. finanzielle Fragen schwierig weil Datenpflege von DNB vermutlich nicht auf ewig gefördert werden wird
## José Calvo Tello: Literaturwissenschaft, Korpora und Normdaten: Vorteile und Herausforderungen
* Wie stellen Literaturwissenschaftler:innen Korpora zusammen?
* analog wie digital ähnlich: Bsp.: Person, Geburtsdaten (Jahr, Ort, Staatsangehörigkeit), Geschlecht - Werke: Originalsprache, Veröffentlichungsjahr, Gattung
* Was gewinnen wir durch Normdaten?
* Korpus ohne Normdaten: isoliert
* Korpus mit Normdaten: viel besser mit weiteren Ressourcen kommunizieren
* Normdatenverknüpfte Korpora ermöglichen Vergleiche von Korpora oder Subkorpora
* weiterer Gewinn: weitere qualitative Daten
* Bsp. manuelle Eingabe von Namen mit GND Normierung - ermöglicht automatische Extrahierung von anderen Daten über GND-id, Bsp. Ortsdaten von Geburt und Tod
* Deutsches Korpus in European Literary Text Collection
* durch Normdaten auch Vergleiche verschiedener Korpora möglich mit relativ geringem Aufwand
* Werk sehr wichtig für Literaturwissenschaftler aber bisher oft nicht in Normdaten drin (Daten zu Werk und Erstausgabe; auch Sprache, Publikationsjahr als wichtige Angaben)
* Gattung zentrale Information
* weitere wichtige Entitäten: Verlage oder literarische Preise
* bislang noch deutlicher Schwerpunkt auf deutschsprachigen Daten in GND
* Herausforderungen:
* blinder Fleck hinsichtlich fremdsprachlicher Instanzen
* Können andere Philologien als die Germanistik mit der GND arbeiten?
* Wie kann man mitmachen als Forscher:in?
* Forscher können neue Instanzen in GND vorschlagen oder vorhandene Instanzen mit weiteren Daten anreichern
* Gattung, Erzähler, Protagonist, ...
* Wie funktioniert Kommunikation Wissenschaft und GND?
* review?
* wer entscheidet bei Kontroversen?
* Rückfrage: Sollen inhaltserschließende Metadaten in die GND aufgenommen werden oder nicht (insbesondere bei Werken)? (Bsp. Erzähler, Protagonist etc.)
* Wenn ja, wie tief sollte diese Werkerschließung am GND Werksatz gehen? (Kett)
* Gattung oft zentrales Kriterium für Korpuszusammenstellung bei Literaturwissenschaftlern
* GND eigentlich zur Identifikation da und weniger zur Interpretation (wozu auch Gattung etc. gehören könnte)
* Diskussion um den Werknormsatz (und dessen Datenmodell und interne Differenzierung) noch nicht endgültig geklärt
## Breakout 3: Was und wie kann ich als Forschende/r beitragen? Welche Unterstützung benötige ich?
* TK in Gruppe B
* Unterstützung nötig, um überhaupt erst einmal herauszufinden, was schon vorhanden ist und was nicht
* GND Explorer ist eine Option, aber tool noch recht neu: https://explore.gnd.network/
* aus nichtdeutschsprachigem Raum noch kaum Normdatensätze vorhanden
* Wie finde ich die richtige ID zu einer Person (oder andere). Entscheidung idR nur durch Fachwissenschaftler:innen? Gerade bei allerweltsNamen schwer, weil Trefferliste sehr groß. Diese einzugrenzen ist mit der GND derzeit schwierig. Uwe Kretschmer (SAW) haben deshalb Tool gebaut, um sich Treffer in einer Tabelle anzeigen zu lassen und die Auswahl der richtigen Person zu vereinfachen. Das Tool hier: http://basicdemo.saw-leipzig.de Alternativ ginge das möglicherweise auch mit Open Refine.
* Weitere ALternative ist die OGND: http://swb.bsz-bw.de/DB=2.104/?COOKIE=Us998,Pbszgast,I2017,B20728+,SY,NRecherche-DB,D2.104,Eb2670a26-1407,A,H,R130.60.149.195,FY
* bei immer weiteren Dienste und Tools wäre eine Übersicht nützlich, da man den Überblick schnell verliert
* das im Vortrag genannten Beispiel einer fragwürdigen GND Werktitel zu tief erschlossenen Gedichts: Der Erlkönig: https://explore.gnd.network/gnd/4424800-3 stammt aus dem Projekt "Werktitel als Wissensraum ISIL DE-32"
* EE in Gruppe A
* einfache Zugänge für Wissenschaftler zur GND nötig um Daten einzuspeisen
* zentraler Ansprechpartner nötig für Workflow (wie soll was angelegt werden, in welchem Format etc.)
* validiertes XML-Schema wäre hilfreich sodass klar welche Infos in welche GND-Felder eingetragen werden sollen
* noch sehr viel Info-/Schulungsbedarf
* Fachwissenschaftliche Expertise auch hilfreich bei Aushandlung welche Infos in GND sollen und welche nicht
* Forscher müssen ihre Projektergebnisse erreichen <=> GND-Datenanreicherung eher als Zusatzaufgabe gesehen die zwar wichtig aber wofür nicht unbedingt Ressourcen übrig => wichtig dass sich GND-Ergänzung gut in eigene Workflows integrieren lässt
## Gemeinsame Auswertung der Ergebnisse (Barbara Fischer & Stefan Buddenbohm & alle)
* geclustertes Board
* [Aufgaben der GND-Agenturen](https://gnd.network/Webs/gnd/DE/Mitmachen/Aufgaben/aufgaben_node.html)
* Kett fragt danach, welches Projekt konkret Bedarf an Unterstützung seitens der GND hat
* Referenzimplementation (Beispielprojekt; Was sind die Workflows?) durch GND erstellt, sagt Barbara Fischer
* momentan v.a. die Frage wie (vorhandene) Daten von Forschern an GND übergeben werden können
* zwei Schritte: lokale Anreicherung - dann in GND
* Wissen aus Forschungsprojekten sollte unbedingt an GND gemeldet werden damit Datenqualität verbessert werden kann <=> automatisierte Anreicherungen können auch fehlerhaft sein, sollten ggf. als solche geflaggt werden
* Umgang mit historischer Dimension von Geografika für gesamte text+ Community relevante Frage
* bereits einige Regeln vorhanden, müssen ggf. besser bekannt gemacht und kommuniziert werden
* Anforderungen könnten sich je nach aktuellen Bedarfen der Forschung/Anwendungsfällen auch ändern
* bei zunehmender Historisierung der GND müssen ggf. Regeln neu bestimmt werden (Bsp. sorbische Orte vom MA bis heute), betrifft bei Orten in diachroner Perspektive aber sehr viele Orte
* mapping zwischen GND und DTA mittels BEACON file (Vorschlag von Harald Lordick, STI)
* mapping zu LoC subject headings interessant (bereits vorhanden) + genre terms (gibt's wohl noch nicht)