Factsheet Linked Data Plattform Bund ==================================== Management Summary ------------------ Mit der Linked Data Plattform stellt das Bundesarchiv eine Umgebung zur Verfügung, mit der in der Bundesverwaltung erstellte und gepflegte Daten aufbereitet der Öffentlichkeit zur Verfügung gestellt werden können. Aufbereitete Daten bedeutet in diesem Kontext, dass die Daten mit _Linked Data_ Technologie untereinander verknüpft sind und nebst den eigentlichen Daten auch entsprechende Metadaten bereitgestellt werden. Ziel ist ein once-only Prinzip für Daten: Jede Datenhalterin und jeder Datenhalter stellen ihre Daten in einer standardisierten Form zur Verfügung. Nutzer von Daten auf Basis Linked Data verweisen sodann nur auf diese Daten, was die Effizienz in der Datenhandhabung steigert und Kosten einspart. Für Nutzer der Daten bedeutet dies eine starke Vereinfachung des Zugangs zu offenen Daten. ### Abgrenzung zu klassischen Ansätzen Heute werden Daten meistens aus dem System exportiert, in welchem sie gehalten werden und von dort arbeits- und zeitintensiv bei jedem neuen Anwendungsfall in ein entsprechendes System eingearbeitet und damit dupliziert. Typischerweise erfolgt heute ein Export als CSV, XML, JSON oder Datenbank-Dump. Wer die Daten nach einem Export weiterverwenden will, muss viel Zeit investieren, um das Format und die Semantik zu verstehen, sie entsprechend aufbereiten und in das System importieren, in welchem sie weiterverwendet werden sollen. Diese Arbeit muss für jeden Datensatz mit jeder zusätzlichen Nutzung gemacht werden. ### Linked Data Lösungsansatz und Vorteile Durch das Bereitstellen von aufbereiteten Daten als Linked Data durch den Datenhalter, kann der oben genannte Zeit- und Kostenaufwand erheblich reduziert werden. Die Notwendigkeit der Aufbereitung pro Datensatz in neuen Anwendungsfällen entfällt zu einem grossen Teil. Beim Datenhalter bekanntes, aber oftmals nur implizit vorhandenes Wissen über die Daten wird im Prozess der Überführung nach Linked Data allgemein zugänglich gemacht. Als Resultat stehen die Daten aufbereitet zur Verfügung und enthalten nebst den eigentlichen Daten auch die entsprechenden Metadaten in maschinenlesbarer Form. Das implizite Wissen des Datenhalters wird explizit als Information zusammen mit Daten abgelegt und somit zugänglich gemacht. Der Datenhalter agiert dabei als Domänenspezialist: Wenn die Daten gut aufbereitet und mit der richtigen Interpretation (Semantik) zur Verfügung gestellt werden, erhöht dies die Chance einer korrekten Wiederverwendung durch Drittnutzer erheblich. Statt diese Arbeit an die Nutzer der Daten zu delegieren und damit zu vervielfachen, wird sie einmalig und korrekt beim Datenhalter selber gemacht. Der Datenhalter festigt durch die professionelle Bereitstellung damit auch seine Autorität über die Daten. Mit Linked Data können Datensätze auch ohne spezifischen Anwendungsfall bereitgestellt werden. Durch standardisierte Zugriffsschnittstellen können Nutzer der Daten entsprechend Abfragen machen. Die standardisierte Abfragesprache bietet unter anderem Funktionalität zu Pivoting, Slicing, Aggregationen und vielem mehr. Linked Data Plattform Bund -------------------------- Mit der Linked Data Plattform Bund steht eine Basis-Infrastruktur für das automatisierte Erstellen und Bereitstellen von Linked Data zur Verfügung. Die Plattform reduziert den Aufwand für neue Datenhalter in die Technologie einzusteigen und unterstützt interessierte Behörden, Ihre Daten ebenfalls als Linked Data zur Verfügung zu stellen. Die Plattform selber besteht aus folgenden Komponenten und entsprechender Infrastruktur: - Skalierbare Datenbankumgebung für Linked Data - Technische Werkzeuge, um Daten nach Linked Data zu überführen - Werkzeuge zur entsprechenden Automatisierung dieser Prozesse - Webapplikationen zum vereinfachten Konvertieren von tabellarischen Daten, beispielsweise zeitbezogenen Daten (Statistische Daten, Messreihen usw.) - Webapplikationen zum Visualisieren von zeitbezogenen Daten Sämtliche Komponenten können entsprechend den Anforderungen neuer Teilnehmer der Plattform angepasst und erweitert werden. Die Plattform profitiert dabei vom Networking-Effekt, durch jeden neuen Anwendungsfall wird der Mehrwert für die Nutzer der Plattform grösser. Exemplarische Anwendungsfälle (Auswahl) --------------------------------------- - Das historisierte Gemeindeverzeichnis steht seit 2013 als Linked Data zur Verfügung. Neue Versionen der Daten werden zeitnah zur Verfügung gestellt, beispielhafte Abfragen ebenfalls. Das Historisierte Gemeindeverzeichnis gehört zu den am meisten verwendeten und kopierten Daten in der Schweiz und ist erfahrungsgemäss oftmals hoffnungslos veraltet in den Dritt-Datenbanken. - Swisstopo stellt für Gemeinden, Kantone und die Schweiz Linked Data zur Verfügung. Mit den Daten ist es beispielsweise möglich, dynamische Karten mit aktuellen Formen/Umrissen von Gemeinden und Kantonen zu erstellen. Die Daten verweisen zudem auf das historisierte Gemeindeverzeichnis (und umgekehrt) und Wikidata. - Das Bundesamt für Umwelt (BAFU) stellt verschiedenste Datensätze als Linked Data zur Verfügung. Die Datensätze bestehen dabei oftmals aus Zeitreihen, welche Daten zur Umwelt betreffen. Durch das Bereitstellen in einem standardisierten Format (RDF Data Cube) wird sicher gestellt, dass gängige Visualisierungen erstellt und die Daten einheitlich weiterverwendet und abgefragt werden können. - Das SECO stellt die Bewilligungs-Datenbank neu als Linked Data zur Verfügung. In diesem Anwendungsfall wurden die Daten nicht nur nach RDF überführt, sondern auch die bestehende Webanwendung ersetzt. Die Daten werden nun mit einer Webanwendung direkt auf der Linked Data Plattform Bund gepflegt und veröffentlicht. Eine eigene Datenbank ist dafür nicht mehr nötig. In der vorherigen Anwendung wurden Daten vom BFS (historisiertes Gemeindeverzeichnis) und der Bundeskanzlei (Termdat) dupliziert. Durch das überführen nach Linked Data entfällt die Pflege der beiden Datensätze, diese werden nun verlinkt. Durch automatisierte Prozesse wird regelmässig überprüft, ob Bewilligungen auf Gemeinden oder Behörden verweisen, die in der Form nicht mehr existieren. Die Datenpflege wird dadurch verbessert und besser gesteuert. - Die ElCom stellt die aktuellen und vergangenen Strompreise neu als Linked Data zur Verfügung. Die bestehende Datenbank soll 2020 abgelöst und die Webapplikation direkt auf die als Linked Data aufbereiteten Rohdaten zugreifen. Nebst den Strompreisen werden auch sämtliche Stromnetzbetreiber in der Schweiz als Linked Data bereitgestellt. # TODO * Highlevel Prozess beschreiben, nicht technisch, minimale Schritte, eine Hand voll Screenshots