NextGEOSS – Open Data in der Erdbeobachtung

Die EU hat erhebliche Investitionen in Erdbeobachtung investiert. Die dabei massenhaft produzierten Daten sollen als Open Data bereitgestellt werden.  Dazu dient das Projekt NextGEOSS, das eines der größten Open Data Projekt in Europa ist. Hier soll dazu ein Überblick gegeben werden.

Copernicus ist das Erdbeobachtungsprogramm der Europäischen Union, wo mit Satelliten und In-Situ-Messungen (auf dem Boden) die Erde beobachtet wird. Mit Satelliten der Sentinel-Missionen werden von Satelliten zum Beispiel Foto-, Radar oder Laser-Aufnahmen erzeugt.

Die Europäische Union hat beschlossen, dass diese Daten als Open Data einer größtmöglichen Nutzung zugeführt werden. Dazu hat sie im Rahmen ihres Horizon 2020 Programmes 2016 das Projekt NextGEOSS (https://nextgeoss.eu/) aufgelegt mit einem Budget von 10 Mio. €, in dem 27 Partner aus Wissenschaft und Wirtschaft zeigen, wie diese Erdbeobachtungsdaten genutzt werden können.
NextGEOSS katalogisiert nicht nur die vorhandenen Daten, sondern zeigt auch, wie sie angewendet werden können. Dazu wurden zehn Piloten definiert, die in einer Cloud numerisch intensive Rechnungen durchführen können. Die Piloten suchen dann im Katalog für sie passende Daten aus den Metadaten und laden dann diese Daten direkt von der Quelle herunter. Piloten wurden aus den Bereichen Agriculture, Biodiversity, Space and Security, Cold Regions, Air Pollution, Disaster Risk Reduction, Territorial Planning, Food Security, Smart Cities, Energy, Solar Mapping und weiteren ausgewählt, die Applikationen in der Cloud laufe lassen und über Portale  ihre Leistung abgeben.

Zwei Beispiele sollen das verdeutlichen:
1. Ernteerträge steigern durch Nutzung der NextGeoss-Daten
Die Firma Vito hat über Open Search eine Ackerbau-Anwendung an den Katalog angeschlossen. Mit dem Ergebnis kann dann Vito den Bauern beraten, ob er für seinen Acker mehr/weniger Wasser oder Dünger auftragen soll. Damit kann sich der Ernteertrag um bis zu 15 % steigern lassen, was auch bei kleineren und mittleren Betrieben von 20-200 ha ein erheblicher Betrag sein kann. Die Anfrage über Maschine-Maschine-Kopplung kann verbal so aussehen: gibt mir bitte Radar-Daten von Sentinel 2 aus Nordbelgien, die in diesem Gebiet dieser Bounding-Box liegen für die Monate März bis August 2018. Der Katalog schickt dann Metadaten, die dazu passen, und das Programm kann sich die dazu gehörigen Bilder an der Quelle holen und dann erfolgt eine Zeitreihenanalyse dieser Bilder.

2. Biodiversität analysieren
Die Universität von Twente nutzt im Piloten Biodiversity Laser-Bilder, z.B. aus dem Bayerische Wald, um mithilfe von Machine-Learning-Algorithmen einzelne Bäume/Baumarten zu erkennen, um dann daraus Schlüsse zu erarbeiten, wie sich die Biodiversität in diesem Wald entwickelt. Schrumpft der Wald als Ganzes? Verändert sich die Zusammensetzung des Ökotops?
Neben diese technischen und wissenschaftlichen Themen werden in NextGEOSS auch ökonomisch Fragen diskutiert. Zum Beispiel wurde durch drei portugiesische Studenten, die gerade ihren Master of Business Administration am MIT in Boston, MA, absolviert hatten, in einer Studie evaluiert, welche Pilotprojekte den größten Nutzen bringen würden und somit priorisiert werden müssten.  Grundsätzlich gilt für NextGEOSS, dass die Nutzenorientierung an den 17 Sustainability Goals (Nachhaltigkeitszielen) der Vereinten Nationen ausgerichtet sind.
Zusammenfassend lässt sich sagen, dass die EU große Anstrengungen unternimmt, um vorhandene Daten als Open Data einer maximalen Nutzung zuzuführen, wobei das Projekt komplex ist und technisches, wissenschaftliches und ökonomisches Know-How aus ganz Europa zusammengeführt wird und sich auch mit anderen Weltregionen austauscht.
Die folgende Abbildung skizziert den oben beschriebenen Datenfluss:

Abbildung Datenfluß NextGEOSS

Abbildung Datenfluß NextGEOSS

Ein paar technische Daten:

Viderum baut dafür auf der Basis der Open Source Software CKAN einen Katalog mit den Metadaten „geharvestet“. Das bedeutet, dass von den Datenquellen die Metadaten abgeholt werden und in CKAN gespeichert werden.  Das kann man sich wie in einer Bibliothek vorstellen, wo in einem Katalog die Metadaten der Bücher aufgeschrieben werden: Autor, Titel, Kategorie, Erscheinungsjahr, ISBN-Nummer. Die Bücher selbst sind dann woanders.

CKAN geht dann also zu den Quellen der Satellitendaten und holt sich dort z.B. die Metadaten z.B. von Sentinel-2 Missionen mit Radar-Bildern.  Vorgesehen sind dabei die Unterstützung diverser Metadatenstandards wie DCAT, GeoDCAT, diverse ISO-Standards aus der INSPIRE-Welt. Auch können die Daten „getagt“ werden, d.h. wenn man z.B. die Geokoordinaten eines Bildes kennt (Rechts- und Hochwert), dann kann man zum Datensatz auch dazuschreiben, dass das Bild in Hannover und in Niedersachen liegt.

Zur Suche in dem Datenbestand kann man dann entweder mit einem Webbrowser suchen (Provider, div. Filter, Datenformat, mittels einer Karte oder mit einer Freitextsuche usw.). Oder man lässt eine Maschine mit dem Katalog kommunizieren. Diese geht mittels der OpenSearch-Standards oder mit Techniken des semantischen Webs (RDF-Triplets oder SPARQL-Queries).

Autor: Wolfgang Ksoll
Mehr zum EU-Projekt erfahren Sie hier: NextGEOSS: https://nextgeoss.eu/
Blog des Autors zu Open Data: http://wk-blog.wolfgang-ksoll.de/

Zuerst am 30.8.2018 erschienen unter:
https://www.viderum.de/2018/08/30/nextgeoss-open-data-in-der-erdbeobachtung/

Dieser Beitrag wurde unter Uncategorized veröffentlicht. Setze ein Lesezeichen auf den Permalink.