News

Neuer Artikel in Biogeosciences

21.05.2026

Wie zuverlässig sind Vorhersagen, wenn die Realität anders aussieht als die Trainingsdaten?

Um Resilienz gegenüber dem Klimawandel aufzubauen, müssen wir unsere Ökosysteme besser verstehen. Fernerkundung und Deep Learning können uns viel über Pflanzeneigenschaften verraten, die für Umweltanwendungen eine Rolle spielen. Hyperspektrale Satellitenmissionen sammeln Daten zu biophysischen, biochemischen und strukturellen Variationen in Vegetationsbedeckung, während Deep Learning Modelle dabei helfen, Pflanzeneigenschaften auf Grundlage dieser Fernerkundungsdaten vorherzusagen.

Doch hier liegt das Problem: Wenn Deep-Learning-Modelle auf Daten angewendet werden, die sich von den Trainingsdaten unterscheiden (Out-of-Domain: OOD), beispielsweise aus anderen Regionen, Biomen oder von anderen Sensoren erhoben, werden die Vorhersagen ungenauer. Deshalb ist es wichtig, die Unsicherheit der vorhergesagten Werte zuverlässig zu quantifizieren.

Da Methoden zur Unsicherheitsabschätzung häufig zu optimistisch sind, schlagen Cherif et al. in ihrem neuen Artikel in Biogeosciences eine distanzbasierte Methode zur Unsicherheitsabschätzung (Dis_UN) vor. Die Methode basiert unter anderem auf mehrjährigen Datensätzen, die an der LMU München in der Forschungsgruppe von Tobias Hank erhoben wurden. Sie quantifiziert Unsicherheit, indem sie misst, wie (un)ähnlich die Trainingsdaten und neue Daten sind. Grundlage dafür sind Quantilregressionen, die Worst-Case-Szenarien abbilden (also den höchstmöglichen Fehler).

Zentrale Ergebnisse
Die Methode zeigte besonders gute Ergebnisse bei gemischten Pixeln in Satellitenbildern: Bei einer Auflösung von 30 m enthält ein Pixel häufig mehrere Landbedeckungstypen, was Vorhersagen mit konventionellen Methoden erschwert. Dis_UN identifizierte diese Pixel dennoch als unsicher, da sich ihre spektralen Signaturen von den Vegetationsproben unterschieden, die für das Training verwendet wurden.

• Dis_UN war sowohl besser interpretierbar als auch recheneffizienter: Anstatt auf viele wiederholte Modelldurchläufe angewiesen zu sein, schätzte die Methode die Unsicherheit anhand der Datenähnlichkeit ab. Dadurch wurden die Ergebnisse leichter verständlich und konnten deutlich schneller für großflächige Fernerkundungsanwendungen berechnet werden.
Die Bewertung von Unsicherheiten ist ein wichtiger Schritt, wenn Modelle außerhalb ihres Trainingsbereichs angewendet werden. Nur so können wir verlässliche und robuste Aussagen über unsere Ökosysteme treffen, die den Aufbau von Resilienz in einem sich erwärmenden Klima unterstützen.

Unsicherheiten verlässlich abschätzen zu können ist wichtig, wenn Modelle außerhalb ihres Trainingsbereichs angewendet werden. Nur so können wir robuste Aussagen über unsere Ökosysteme treffen und mehr Resilienz in einem immer wärmer werdenden Klima schaffen.

Zum Artikel