habe lediglich qualitative Daten erhoben und am workshop openrefine teilweise teilgenommen Ich habe bisher nur qualitive Daten erhoben und ausgewertet.
bisher habe ich noch keine Erfahrungswerte sammeln können in der Datenerhebung
Datenbereinigung mit Openrefine
Zum Einstieg…
Mein fachlicher Hintergrund ist…
Germanistik
Ich gehöre zu…
TU Darmstadt
Gotehe-Uni
Goethe-Universität
Goethe-Uni
Goethe Uni
TU Darmstadt
TU Darmstadt
Goethe-Uni
Goethe Uni
TU Darmstadt
Goethe Uni
Goethe Uni
-Uni Mainz
Andere hessische Hochschule
Goethe-Uni
Sonstige
| | | |
Themenvorschläge für die Hands-on Übung zur Datenbereinigung mit Openrefine (bitte ergänzen Sie!)
Einführung in R
Mich interessiert R, weil…
Themenvorschläge für die Hands-on Übung zu Einführung in R (bitte ergänzen Sie!)
bis heute noch nicht..
bin auf dem guten Weg
Anregungen und Wünsche (z.B. bestimmte Vertiefungen)
-Für Einsteiger fand ich die Veranstaltung nicht unbedingt geeignet. Es wurden sehr viele Basics vorausgesetzt.
Tidy data - Basics
Zum Einstieg…
Haben Sie schon einmal Daten erhoben / bereinigt? Wofür und welches Tool haben Sie benutzt?
nein
nein
ein wenig mit OpenRefine
Ja, aber vermutlich bloß recht basal - habe mit .csv gearbeitet, vielleicht fällt auch der Umgang mit maschinenlesbar gemachten Handschriften darunter
nein, bzw. nur in vergangenen Kursen des Praxislabor
habe mein BA-Arbeit mit R gemacht und musste dort Zeitungsartikel auswerten
im Seminar "Data Literacy" (KJL, Dr. Giesa) haben wir mithilfe der Datenbank der Bibliothek für Jugendbuchforschung und Excel Daten zu kinder- und jugendliterarischen Themen erhoben und ausgewertet.
Ich habe erste Erfahrungen in der Erhebung von social media Daten mit R & Python und habe diese sowohl in R als auch Python bereinigt
Ich habe quantitative Textdaten erhoben und mit R ausgewertet
Nein, noch keine Erfahrung.
Übung (Beakout-Room; ca. 10 Minuten)
Laden Sie bitte diese Datei herunter. Was könnte an dieser Art der Datenerhebung nicht ganz optimal sein? Was könnte man besser realisieren? Fassen Sie bitte ihre Beobachtungen hier zusammen.
können zwei Tabellen in einer Datei sinnvoll ausgelesen werden?
Spaltenbezeichnungen/Maßeinheiten nicht einheitlich
Monate nicht ausschreiben, sondern als Nummern angeben, außerdem die Tage einheitlich (01, anstelle von 1, da sonst die Monate durcheinander geraten)
Cancelled ja/nein lieber nicht durch farbliche Markierung, sondern in neuer Spalte als Variable
PGR/PDRA/other lieber auftrennen in verschiedene Spalten statt nur eine
Versionierung über Git und nicht über das 4. Tabellensheet
Chronologische Sortierung der Tabellenblätter
Nicht zwei Tabellen nebeneinander in einem Sheet anlegen
Nicht mehrere Informationen in einer Spalte (in 2016)
Vereinheitlichung der Tabellen!
verschiedene Einheiten
Übung
Schauen Sie sich bitte in der Übungstabelle die Datumsangaben für 2015 an. Extrahieren Sie Monat, Tag und Jahr jeweils in eine neue Spalte mit den entsprechenden Funktionen:
=TAG(A2)
=MONAT(A2)
=JAHR(A2)
Welche Beobachtung können Sie machen?
Feedback
Helfen Sie uns mit Ihrem Feedback, das Angebot zu verbessern
Einführung in manuelles Webscraping mit dem Browser-Plugin Scraper
Warm-up
Was interessiert Sie an dem Thema Webscraping? Was ist Ihre Motivation am Workshop teilzunehmen?
Bin Einsteiger und am Thema interessiert
Mir ist Datascraping in den letzten Jahren immer mal wieder über den Weg gelaufen, und habe mich eher theoretisch damit beschäftigt, aber es bisher noch nie praktisch selbst ausprobiert. Ich hoffe hier vielleicht einen Zugang dazu zu finden und das vielleicht auch für weitere Lehrveranstaltungen o.Ä. zweckentfremden zu können
Ist Teil meines Einarbeitungsplans, finde das Thema aber auch recht interessant
Habe noch nichts davon gehört und fand eine Einführung in diesem Rahmen daher sehr spannend
Ich habe noch keine Erfahrung _ ich habe noch keine Vorkenntnisse und möchte gerne etwas darüber erfahren