# Digital Humanities: Tools zur Text- und Datenvisualisierung [Multimediawerkstatt](https://www.studiumdigitale.uni-frankfurt.de/58534353/Offene_MultimediaWerkstatt?) am 17. November 2020 Referentin: Agnes Brauer, Universitätsbibliothek JCS (a.brauer@ub.uni-frankfurt.de) ## Ankommen - Vorstellung - Mentimeter zum Kennenlernen: https://www.menti.com/zpresax5w4 - Vorstellen des HackMD-Pads - Begründung Themenauswahl: - Voyant-Tools - Datenanreicherung- und Visualisierung mit OpenRefine ## Text-Visualisierung mit den Voyant-Tools ![](https://i.imgur.com/kTkk2sF.png) > Abb.: Toolansicht Voyant ### Ziele - Erste Erfahrungen sammeln in Distant reading - Kennenlernen des webbasierten Tools Voyant: - Textimport - Werkzeugauswahl - Bearbeiten einer Stoppwortliste - Exportieren der Visualisierungen - Interpretation - Testen ### Fragen - Test ### Links Voyant tools: https://voyant-tools.org/ Voyant guide: https://voyant-tools.org/docs/#!/guide/start Beispieltext (Goethes Faust): https://textgridrep.org/browse/11g9q.0 ### Übung (7 Minuten, alleine) - Laden Sie den Beispieltext (Goethes Faust) als *Plain text* herunter, speichern diesen ab und importieren Sie ihn in die Voyant tools - Nehmen Sie sich einen Augenblick Zeit und verschaffen Sie sich einen ersten Überblick über die Benutzeroberfläche - Nutzen Sie bitte die grünen / roten Zoom-Buttons in der Teilnehmerliste ![](https://i.imgur.com/90xHmIS.png =60x), um zu signalisieren, dass Sie bereit sind, weiter zu machen / noch etwas Zeit benötigen. ### Übung (5 Minuten, alleine) - Für welche der fünf Tools lässt sich eine Stoppwortliste festlegen? Welche Grundeinstellungen finden Sie hier vor? - Tragen Sie Ihre Ergebnisse hier ins Pad ein: - Sophia: Reader (über Optionen) - Gloria: Cirrus - Options - Auto Detect - Daniel Birnstiel - alle fünf - Sophia: Trends (über Optionen) - Corpus Tools -> Otionen -> Auto-detect - AWD: Alle 5 - Olga R: Cirrus -> Options -> Auto Detect - Milena: Bubblelines - Christian Treppesch - Context -> Options - Stopwords -> - Jan Schäfer - Cirrus/Reader/Trends/Summary/Context - Options - Auto-Detect - Ana Pinera - Stopwords können für alle fünf Tools vergeben werden; Grundeinstellung ist auto-detect - Susanne Frühauf - Summary --> Auto-Detect - in allen ![](https://i.imgur.com/xD2U4Vq.png) ### Übung (7, in Breakout-Rooms) - Was macht eine gute Stoppwort-Liste aus? Manipulieren Sie die Stoppwortliste und beschreiben Sie die entstehenden Effekte: - Orientierung an der Fragestellung - Identifizieren der relevanten Begriffe und - Löschen der nicht der nicht relevanten Begriffe, - mit White list gewünschte Wörter untersuchen - Gruppe 2: Default Stop list ist sehr umfangreich und enthält viele sinntragende Begriffe, - Beitrag Gruppe 3 - Beitrag Gruppe 5: Man kann über "Edit List" rausnehmen, die wenig Sinn machen, indem man sie in der Sperrwort-Liste ergänzt. Dann verändert sich die Wortwolke entsprechend und wird aussagekräftiger. Wir rätseln noch, wie die Sache mit der white list funktionieren könnte... ### Übung (15, in Breakout-Rooms) Schauen Sie sich die Wortwolke an: Welche Wörter kommen besonders häufig, welche weniger häufig vor? Versuchen Sie ausgehend von den Worthäufigkeiten eine erste Interpretation, indem Sie Hypothesen über Inhalte, Handlungen und epochentypische Merkmale aufstellen. Halten Sie Ihre Beobachtungen im Pad fest. Beobachtung Gruppe 1 Beobachtung Gruppe 2 - grundlegende christliche, philosophische/ethische Begriffe kommen besonders häufig vor. Deutet auf den ersten Blick auf einen religiös-philosophischen Diskurs hin; Emotionen und Wertungen; - Begriffe der Natur, des Körpers und der Sinne kommen am seltesten vor. - epochal in der Aufklärung einzuordnen; rational konnotiert; Auseinandersetzung zwischen Verstand und der Welt, 'Rechtsdiskurs'/ethischer Diskurs: Was ist gut und recht? Beobachtung Gruppe 3 - Wir würden gerne wissen, ob man Begriffe "zusammennehmen" kann. Herz und Herzen taucht in der Wolke in mittlerer Größe auf - dasselbe Lexem, was eigentlich irreführend ist. - Einmal Herz&Herzen wäre viel dicker in der Wolke - Richtig spannend wäre es, diese Wolke nun mit einer Frequenzwortschatzliste / **Grundwortschatz** zu kontrastieren - damit würde das Eyeballing durch ein systematischeres Verfahren ergänzt, um Themenschwerpunkte zu erschließen Beobachtung Gruppe 4: - Es scheint um Leben/Menschheit zu gehen, da viele Wörter sich mit Menschlichkeit befassen (Mensch, Leben, Kind, Mutter, Freund, Herr,...) . Darüber hinaus scheint Sehnsucht/Leid o.Ä. ein Thema zu sein (o, ach) ### Übung (7 Minuten, alleine) Vayant Tools wird kontinuierlich weiterentwickelt und bietet zwischenzeitlich 29 verschiedene Tools an, die für Ihre Bedarfe individuell zusammengestellt werden können: ![](https://i.imgur.com/jmrgFxq.jpg) >Abb.: Ersetzen der voreingestellten Tools durch die Integration eines externen Voyant-Tools; [Quelle](https://fortext.net/routinen/lerneinheiten/textvisualisierung-mit-voyant) In den [Voyant Guides](https://voyant-tools.org/docs/#!/guide/about) finden Sie ausführliche Beschreibungen der vorhandenen Tools. Erstellen Sie eigene Explorationsumgebungen, exportieren Sie Ihre Voyant-Sitzung als URL und posten Sie diese hier: - URL 1 - URL 2 - URL 3 - ... ### Gute Quellen für Textcorpora in Auswahl - Deutsches Textarchiv: http://www.deutschestextarchiv.de/ - TextGrid Repository: https://textgridrep.org/ - Digitales Wörterbuch der Deutschen Sprache: https://www.dwds.de/r ### Weitere Informationen zu Tools zur Textanalyse und Visualisierung - forText: https://fortext.net/ - Dariah-DE: https://de.dariah.eu/dienste-und-werkzeuge - Clariah-DE: https://www.clariah.de/index.php/ueber-uns/diensteliste ## Datenanreicherung- und Visualisierung mit OpenRefine und dem Dariah Geo-Browser ![](https://i.imgur.com/lWhv3w4.png) > Abb.: Reconciliation in Openrefine ### Ziele - Kennenlernen des Dariah-Geo-Browsers - Erfassen der Struktur des Dariah Datasheets - Importieren von Daten in Openrefine - Nutzen eines Reconciliation Services zum Anreichern von Daten - Anpassen der Daten an das Dariah-Datasheet - Exportieren des Datasheets - Importieren des Datasheets für die Visualisierung im Dariah Geo-Browser ### Links - Openrefine: https://openrefine.org/ - Tutorial zum Umgang mit Openrefine: https://librarycarpentry.org/lc-open-refine/ - Recinciliation mit Openrefine: https://github.com/OpenRefine/OpenRefine/wiki/Reconciliation - Übersicht über Reconciliation Services: https://github.com/OpenRefine/OpenRefine/wiki/Reconcilable-Data-Sources - Link zum Übungsdatensatz: https://hessenbox-a10.rz.uni-frankfurt.de/getlink/fiHKSUd1i82xPM6fxL26FoCA/NobelWomen.tsv - Link zur Visualisierung im Dariah Geo-Browser: https://geobrowser.de.dariah.eu/index.html?csv1=https://geobrowser.de.dariah.eu/storage/810058 - Dariah Geo-Browser: https://geobrowser.de.dariah.eu/index.html - Dariah Datasheet-Editor: https://geobrowser.de.dariah.eu/edit/ - Dokumentation zum Dariah Geo-Browser: https://geobrowser.de.dariah.eu/beta/doc/datasheet.html ### Übung (7 Min, Breakout-Rooms): Machen Sie sich in kleinen Gruppen mit dem Dariah Geo-Browser vertraut und finden Sie den Aufbau des Datasheets für den Dariah Geo-Browser heraus. Erstellen Sie hier ein Template für die Import-Tabelle. Syntax zum Erstellen einer Tabelle in Markdown (bitte jeweils pro Gruppe nach unten kopieren): | Spalte 1 | Spalte 2 | |--------------- |:--------------- | | Inhalt Spalte 1| Inhalt Spalte 2 | ## Feedback Ich freue mich über Ihr Feedback; tragen Sie bitte eine Sache, die Sie gut fanden und eine, die Sie nicht so gut fanden, in das Padlet ein (anonym): - Padlet: https://padlet.com/braueragnes/jkp4qqjv7rd7ekls ## Hilfe zur Benutzung des HackMDs - [HackMD Tutorials](https://hackmd.io/c/tutorials)