Factsheet Linked Data Plattform Bund
====================================
Management Summary
------------------
Mit der Linked Data Plattform stellt das Bundesarchiv eine Umgebung zur
Verfügung, mit der in der Bundesverwaltung erstellte und gepflegte Daten
aufbereitet der Öffentlichkeit zur Verfügung gestellt werden
können. Aufbereitete Daten bedeutet in diesem Kontext, dass die Daten
mit _Linked Data_ Technologie untereinander verknüpft sind und nebst den
eigentlichen Daten auch entsprechende Metadaten bereitgestellt werden.
Ziel ist ein once-only Prinzip für Daten: Jede Datenhalterin und jeder
Datenhalter stellen ihre Daten in einer standardisierten Form zur
Verfügung. Nutzer von Daten auf Basis Linked Data verweisen sodann nur
auf diese Daten, was die Effizienz in der Datenhandhabung steigert und
Kosten einspart. Für Nutzer der Daten bedeutet dies eine starke
Vereinfachung des Zugangs zu offenen Daten.
### Abgrenzung zu klassischen Ansätzen
Heute werden Daten meistens aus dem System exportiert, in welchem sie
gehalten werden und von dort arbeits- und zeitintensiv bei jedem neuen
Anwendungsfall in ein entsprechendes System eingearbeitet und damit
dupliziert.
Typischerweise erfolgt heute ein Export als CSV, XML, JSON oder
Datenbank-Dump. Wer die Daten nach einem Export weiterverwenden will,
muss viel Zeit investieren, um das Format und die Semantik zu verstehen,
sie entsprechend aufbereiten und in das System importieren, in welchem
sie weiterverwendet werden sollen. Diese Arbeit muss für jeden Datensatz
mit jeder zusätzlichen Nutzung gemacht werden.
### Linked Data Lösungsansatz und Vorteile
Durch das Bereitstellen von aufbereiteten Daten als Linked Data
durch den Datenhalter, kann der oben genannte Zeit- und Kostenaufwand
erheblich reduziert werden. Die Notwendigkeit der Aufbereitung pro
Datensatz in neuen Anwendungsfällen entfällt zu einem grossen Teil.
Beim Datenhalter bekanntes, aber oftmals nur implizit vorhandenes Wissen
über die Daten wird im Prozess der Überführung nach Linked Data
allgemein zugänglich gemacht. Als Resultat stehen die Daten
aufbereitet zur Verfügung und enthalten nebst den eigentlichen Daten
auch die entsprechenden Metadaten in maschinenlesbarer Form.
Das implizite Wissen des Datenhalters wird explizit als Information
zusammen mit Daten abgelegt und somit zugänglich gemacht.
Der Datenhalter agiert dabei als Domänenspezialist: Wenn die Daten gut
aufbereitet und mit der richtigen Interpretation (Semantik) zur
Verfügung gestellt werden, erhöht dies die Chance einer korrekten
Wiederverwendung durch Drittnutzer erheblich. Statt diese Arbeit an die
Nutzer der Daten zu delegieren und damit zu vervielfachen, wird sie
einmalig und korrekt beim Datenhalter selber gemacht. Der Datenhalter
festigt durch die professionelle Bereitstellung damit auch seine
Autorität über die Daten.
Mit Linked Data können Datensätze auch ohne spezifischen Anwendungsfall
bereitgestellt werden. Durch standardisierte Zugriffsschnittstellen können
Nutzer der Daten entsprechend Abfragen machen. Die standardisierte
Abfragesprache bietet unter anderem Funktionalität zu Pivoting, Slicing,
Aggregationen und vielem mehr.
Linked Data Plattform Bund
--------------------------
Mit der Linked Data Plattform Bund steht eine Basis-Infrastruktur für
das automatisierte Erstellen und Bereitstellen von Linked Data zur
Verfügung. Die Plattform reduziert den Aufwand für neue Datenhalter in
die Technologie einzusteigen und unterstützt interessierte Behörden,
Ihre Daten ebenfalls als Linked Data zur Verfügung zu stellen.
Die Plattform selber besteht aus folgenden Komponenten und
entsprechender Infrastruktur:
- Skalierbare Datenbankumgebung für Linked Data
- Technische Werkzeuge, um Daten nach Linked Data zu überführen
- Werkzeuge zur entsprechenden Automatisierung dieser Prozesse
- Webapplikationen zum vereinfachten Konvertieren von tabellarischen
Daten, beispielsweise zeitbezogenen Daten (Statistische
Daten, Messreihen usw.)
- Webapplikationen zum Visualisieren von zeitbezogenen Daten
Sämtliche Komponenten können entsprechend den Anforderungen neuer
Teilnehmer der Plattform angepasst und erweitert werden. Die Plattform
profitiert dabei vom Networking-Effekt, durch jeden neuen Anwendungsfall
wird der Mehrwert für die Nutzer der Plattform grösser.
Exemplarische Anwendungsfälle (Auswahl)
---------------------------------------
- Das historisierte Gemeindeverzeichnis steht seit 2013 als Linked
Data zur Verfügung. Neue Versionen der Daten werden zeitnah zur
Verfügung gestellt, beispielhafte Abfragen ebenfalls. Das
Historisierte Gemeindeverzeichnis gehört zu den am meisten
verwendeten und kopierten Daten in der Schweiz und ist
erfahrungsgemäss oftmals hoffnungslos veraltet in den
Dritt-Datenbanken.
- Swisstopo stellt für Gemeinden, Kantone und die Schweiz Linked Data
zur Verfügung. Mit den Daten ist es beispielsweise möglich,
dynamische Karten mit aktuellen Formen/Umrissen von Gemeinden und
Kantonen zu erstellen. Die Daten verweisen zudem auf das
historisierte Gemeindeverzeichnis (und umgekehrt) und Wikidata.
- Das Bundesamt für Umwelt (BAFU) stellt verschiedenste Datensätze als
Linked Data zur Verfügung. Die Datensätze bestehen dabei oftmals aus
Zeitreihen, welche Daten zur Umwelt betreffen. Durch das
Bereitstellen in einem standardisierten Format (RDF Data Cube) wird
sicher gestellt, dass gängige Visualisierungen erstellt und die
Daten einheitlich weiterverwendet und abgefragt werden können.
- Das SECO stellt die Bewilligungs-Datenbank neu als Linked Data zur
Verfügung. In diesem Anwendungsfall wurden die Daten nicht nur nach
RDF überführt, sondern auch die bestehende Webanwendung ersetzt. Die
Daten werden nun mit einer Webanwendung direkt auf der Linked Data
Plattform Bund gepflegt und veröffentlicht. Eine eigene Datenbank ist
dafür nicht mehr nötig. In der vorherigen Anwendung wurden Daten
vom BFS (historisiertes Gemeindeverzeichnis) und der Bundeskanzlei (Termdat)
dupliziert. Durch das überführen nach Linked Data entfällt die Pflege
der beiden Datensätze, diese werden nun verlinkt. Durch
automatisierte Prozesse wird regelmässig überprüft, ob Bewilligungen
auf Gemeinden oder Behörden verweisen, die in der Form nicht mehr
existieren. Die Datenpflege wird dadurch verbessert und besser gesteuert.
- Die ElCom stellt die aktuellen und vergangenen Strompreise neu als
Linked Data zur Verfügung. Die bestehende Datenbank soll 2020
abgelöst und die Webapplikation direkt auf die als Linked Data
aufbereiteten Rohdaten zugreifen. Nebst den Strompreisen werden auch
sämtliche Stromnetzbetreiber in der Schweiz als Linked Data
bereitgestellt.
# TODO
* Highlevel Prozess beschreiben, nicht technisch, minimale Schritte, eine Hand voll Screenshots