Wie bekommen wir bessere OpenData – Out in the Open March 2022

15.04.2022 von Jörg Reichert - OK Lab Leipzig

Die Europäischen Union hat im März den 3. Teil ihrer Video-Erklär-Reihe zu Linked Open Data veröffentlicht, hier die Verweise auf die einzelnen Teile:

Passend dazu wurde am 17. März die EU-Finanzierungs-Informations-Plattform Kohesio veröffentlicht. Sie basiert auf der Open-Source Software WikibaseHQ und ist auch selbst Open Source. Sie enthält strukturierte Daten über mehr als 1,5 Millionen Projekte und etwa 500.000 Begünstigte, die entweder über den EU-Regional-Entwicklungs-Fond, den EU-Zusammenhalts-Fond oder den EU-Sozial-Fond zwischen 2014-2020 gefördert wurden. Am 28.3. hat Dennis Diefenbach im OKLab Berlin Meetup in seinem Vortrag über den EU-Knowledge-Graph (und dem damit verbundenen Einsatz von WikiData) auch über dieses Projekt berichtet.

In seinem Vortrag “Reality Check: Open Data Deutschland” auf der FOSSGIS Konferenz 2022 berichtet Prof. Dr. Sebastian Meier von der FH Potsdam über die Verfügbarkeit und Qualität von Offenen Daten in Deutschland. Er stellt dabei fest, dass weiterhin die eine Quelle der Wahrheit fehlt. So sind manche Datensätze nur in Geoportal.de nicht aber in GovData aggregiert. Die Arbeit wird zudem durch unsachgemäß und uneinheitlich angegebenen Metadaten sowie Fehler in den Daten selbst erschwert. Dabei sind Standards (z.B. DCAT-AP) und Werkzeuge (z.B. ein Metadaten-Validator) bereits vorhanden, sie müssten dann aber auch in der Fläche eingesetzt werden. Durch einfache Plausibiltätschecks erkennt man so schnell Tippfehler z.B. bei Geokoordinaten bevor man die Daten veröffentlicht. Zudem bemängelte er, dass historische Datensätze meist gelöscht (bzw. von dem jeweils aktuellen Datensatz überschrieben werden), so dass eine Auswertung über den Zeitverlauf nicht möglich ist. Hier wären Change-Reports, die auch semantische Änderungen in den Metadaten dokumentieren, wünschenswert.

Mit dem Koalitionstracker von FragDenStaat lassen sich nun nachverfolgen, ob und wie weit die im Koaliationsvertrag der Bundesregierung versprochenen Vorhaben auch tatsächlich umgesetzt werden.

Der Online-Rechner LocalZero erstellt eine Klimavision (in Form eines PDF-Berichts), wie dein Ort klimaneutral wird. Die Erklärungen zur Einflussbilanz und den Sektorberechnungen sind hier dokumentiert. Der Quellcode ist Open Source. Allerdings sind die Verkehrszählungsdaten des Ifeu gekauft und können daher nicht veröffentlicht werden. Sie werden aber zur Berechnung benötigt, so dass man die Anwendung nicht selbst betreiben, aber zumindest die Berechnungslogik im Quellcode nachvollziehen kann.

Im Rahmen des Citizens-Science-Projekts “Berlin zählt Mobilität” sollen 100 Zählgeräte an interessierte Bürger ausgegeben werden, die, am Fenster angebracht, den Verkehr auf Berlins Straßen erfassen sollen. Die so erfassten Zähl-Daten werden auf dem Server nicht gelöscht und sind via API zeitlich unbeschränkt verfügbar.

Dass es leider auch weniger zugänglich geht, zeigt die Antwort, die Code for Magdeburg auf die Anfrage der Verkehrszähldaten der letzten Jahre für Magdeburg bekommen hat: die Daten werden auf einer DVD zugeschickt, die Weitergabe der Daten ist mit Verweis auf das Informationsweiterverwendungsgesetz (IWG) nur nach Rücksprache erlaubt (das Gesetz ist aber seit 2021 außer Kraft) und dann bei Weitergabe potenziell noch Gebühren verlangt werden.

Der Landtag Brandenburg hat mit dem Design-Update seiner Parlamentsdokumentation begonnen die Metadaten-Dumps als Open Data bereitzustellen und folgt damit dem Berliner Abgeordnetenhaus, was neben seinen Metadaten-Dumps auch noch eine Dokumentation der XML-Struktur als PDF zur Verfügung stellt.