Skalierbare raumzeitliche Statistik für globale Umweltphänomene

Grunddaten zu diesem Projekt

Art des Projektes: Gefördertes Einzelprojekt
Laufzeit: 01.03.2018 - 28.02.2021

Beschreibung

Die heutige Verfügbarkeit offener Erdbeobachtungsdaten ermöglicht die Durchführung komplexer geostatistischer Analysen von Umweltphänomenen auf globalem Maßstab. Die Rechenkomplexität von Operationen auf Gaußschen Zufallsfeldern, global unrealistische Annahmen über raumzeitliche Abhängigkeiten wie Stationarität, Isotropie und raumzeitliche Separierbarkeit, sowie aufwändiges Datenmanagement sobald Datenvolumina lokale Speicherkapazitäten übersteigen begrenzen jedoch zur Zeit den Nutzen der Daten in praktischen Anwendungen und führen zu vielen nicht teil- und reproduzierbaren Studien. Beispielsweise benötigt die Nutzung von nur einigen Terabyte umfassenden globalen Höhenmodellen als Kovariate in der Modellierung der räumlichen Variation von Niederschlagsmengen einerseits schnelle Methoden der statistischen Inferenz, aber andererseits auch einen signifikanten Arbeitsaufwand im Bereich des Datenmanagements. Ziel dieses Forschungsprojekts ist es, neue effiziente Methoden geostatistischer Inferenz von globalskaligen Umweltphänomenen zu entwickeln, die (i) in verteilten Rechenumgebungen hochgradig skalieren, (ii) heterogene raumzeitliche Abhängigkeiten (Nichtstationarität, Nichtseparierparkeit und Anisotropie) berücksichtigen und (iii) in der Lage sind, verschiedene Datenquellen aus satelliten- und bodenbasierten Beobachtungen zu integrieren. Dafür werden sowohl neue geostatistische Modelle, die räumliche Markov Zufallsfelder mit zeitlichen Advektions- Diffusionsprozessen kombinieren, als auch effiziente Algorithmen und Methoden, die an das arraybasierte Datenmanagement und Analysesystem SciDB angepasst sind, entwickelt. Methodische Ergebnisse werden in zwei Fallstudien angewandt und evaluiert. Diese beinhalten das Erstellen eines hochauflösenden globalen Niederschlagsdatensatzes und die Modellierung von Landnutzungsänderung anhand externer unabhängiger meteorologischer Variablen. Zusätzlich zur globalen Modellierung wird letzere Fallstudie auch zeigen, wie die Forschungsergebnise die Handhabung aktueller satellitenbasierter Daten vereinfachen. Dazu werden hochauflösende Sentinel-1 und TanDEM-X daten in einer Landnutzungsänderungsanalyse auf nationalem Maßstab verwendet. Erwartete Ergebnisse des Projektes beinhalten skalierbare Methoden zur geostatistischen Inferenz in verteilten Rechenumgebungen, neue Ansätze heterogene Abhängigkeiten auf globalem Maßstab zu Modellieren und open-source Softwarewerkzeuge für offene und reproduzierbare Analysen globaler Umweltphänomene.

Stichwörter: Geoinformatik; Umweltphänomene