„Die Nidder ist ein linker Nebenfluss der Nidda im Bundesland Hessen, Deutschland. Von der Quelle bis kurz vor der Mündung verläuft sie etwa 10 km südöstlich parallel zur Nidda.“ (Quelle: Wikipedia am 21.01.24) Als zugezogener Nidderauer möchte ich den Fluss kennenzulernen, der nur 100m vor meiner Haustür entlang fließt. Die klassische Erwartung wäre nun sicherlich, dass ich den Fluss ablaufe, doch als Datenanalyst möchte ich die Nidder über ihre Daten kennenlernen und dabei gleich Ideen zur Datenanalyse (Statistik) mitgeben. Dieses Mal soll es um die Temperatur des Flusses gehen. Feedback und Diskussionen sind willkommen.
Alle Grafiken und Datenanalysen wurden mit Minitab 21.4 erstellt.
Zu den Daten
Die hier betrachteten Daten sind frei zugänglich und stammen vom Hessischen Landesamt für Naturschutz, Umwelt und Geologie. Die Temperaturdaten beginnen ab Juli 1989. Für die Nidder liegen die Meldestufen bei 240cm (Meldestufe 1 ("MS1")), 280cm (Meldestufe 2 ("MS2")) und 310cm (Meldestufe3 ("MS3")). Laut dem Hessischen Landesamt für Naturschutz, Umwelt und Geologie kommt Meldestufe 1 zur Anwendung, wenn der Fluss voll ist, Meldestufe 2 beschreibt ein größeres Hochwasser und Meldestufe 3 beschreibt ein außergewöhnliches Hochwasser. Genaueres ist auf der Webseite beschrieben. Was dies aber für jeden individuell bedeutet, hängt von den konkreten Überschwemmungsgebieten (-karten) ab. Wie die Vergangenheit gezeigt hat, wird es im Bereich von "Zum Junkernwald" ab Erreichen von Meldestufe 2 "interessant".
Verlauf über die Jahre
In der rechten Grafik symbolisiert jeder graue Punkt den Höchststand eines Tages. Das ganze wurde über die letzten mehr als 30 Jahre aufgetragen. Die drei eingezeichneten roten Linien markieren die Pegelstände für die Meldestufen 1, 2 und 3. Ein gefüllter blauer Kreis stellt die Jahresmittelwerte und ein blauer Kreis mit einem Kreuz stellt die Jahresmediane dar. Ich mag hier nur oberflächlich auf die Unterschiede eingehen, da sie hier nicht entscheidend sind. Aber Mittelwerte sind bekannter und besser zu verwenden, Mediane sind gegenüber Ausreißer und asymmetrischer Verteilungen stabil. Mit Hilfe der Mittelwerte oder Mediane ist bereits ein abnehmender Trend ersichtlich. Zwar ist 2023 ein Sprung nach oben zu sehen, die maximalen Tageswerte des Jahres zeigen aber keine besonderen Auffälligkeiten.
Verlauf über die Monate
Spannend ist auch die Frage, wann im Jahr die Hochwassergefahr am größten ist. Das Risiko ist nämlich nicht gleichverteilt über das Jahr, sondern vor allem in den Wintermonaten am größten, wie die linke Grafik zeigt. Dort repräsentieren Balken die Anzahl an Tagen der letzten Jahrzehnte, an denen im dargestellten Monat Meldestufe 1, 2 oder 3 erreicht wurden. In den Sommermonaten war das quasi nie der Fall.
Beide Erkenntnisse in einer Grafik ist rechts dargestellt. Hier ist der maximale Wasserstand eines Monats im Fünfjahresintervall eingezeichnet. Rot kennzeichnet hohe Wasserstände und blau niedrige. Wie gut zu erkennen ist, ist zwischen Sommer und Winter meist über ein Meter Unterschied. Auch ist über die Fünfjahresintervalle ein sich ins Blaue verschiebender Trend zu erahnen.
Statistische Analyse
Nun soll der Verlauf nicht nur visuell, sondern auch statistisch untersucht werden. Eine klassische Trendlinie (Regression) ist hier jedoch nicht sinnvoll, da sie typischerweise etwas über den mittleren Verlauf aussagt. Der mittlere Jahresverlauf kann aber bei Hochwasser nicht interessant sein, weil es sich hier um besondere Extremsituationen handelt. Daher soll hier eine abgewandelte Regressionsmethode eingesetzt werden, die in der Pharmazie sehr verbreitet ist:
Dort geht es darum sicherzustellen, dass auf Basis mehrerer Chargen der Wirkstoffgehalt über die Zeit nicht unter ein bestimmtes Minimum sinkt oder Verunreinigungen über die Zeit nicht ein bestimmtes Maximum übersteigen. Der Zeitpunkt, wo die Grenze gerissen wird, definiert dann das Haltbarkeitsdatum des Medikamentes. Diese Grenze wird natürlich nicht über den Mittelwert oder Median bestimmt. Sonst würde es ja bedeuten, dass nach Ablauf des Haltbarkeitsdatums die Hälfte der Medikamente die Grenze schon überschritten hätte, was gerade in diesem Bereich Wahnsinn wäre. Deshalb geht es hier nicht um den mittleren ("50%"-)Wert, sondern eher um den 90%- bis 99%-Wert und zusätzlich wird noch das in der Analyse befindliche statistische Risiko in die Betrachtung mit aufgenommen, was ebenfalls zu Gunsten des Patienten (und damit zu Ungunsten der ausgelegten Haltbarkeit) gerechnet wird. Eine klassische Festlegung für das Mindesthaltbarkeitsdatum wäre also, dass man beispielsweise zu 95% sicher sein möchte, dass bei Erreichen des Haltbarkeitsdatums 95% der Medikamente noch diesseits der Grenze liegen.
In diesem Beispiel geht es um den zeitlichen (Jahres-)Verlauf der Pegelstände. Für meine Kalkulation möchte ich zumindest zu 99% (ich liebe ja mein Haus) sicher sein, dass 99,73% (= klassischer statistischer Wert, der die sogenannte „Natürliche Streuung“ beschreibt und zufälligerweise auch gleich „alle Tage im Jahr, außer einen“ repräsentiert) aller Ereignisse unterhalb meiner Betrachtungslinie liegen, die ich hier mit Meldestufe 2 definiert habe, also 280cm. Dies ist in der oberen Grafik dargestellt. Ich habe mir nicht die Mühe gemacht, die Parameter aus der Pharmazie umzuschreiben. Die 12 unterschiedlichen Farben bzw. Verläufe ("Chargen") sind die 12 Monate, die über den Jahresverlauf dargestellt sind. Prinzipiell nehmen die Höchststände über die Jahrzehnte bei allen Monaten (unterschiedlich stark) ab. 2023 und schon Jahre davor gab es keine Monatslinie mehr, die sich oberhalb von 280cm befand. Das bedeutet, dass ich – die Daten der Vergangenheit zu Grunde genommen – mittlerweile zu 99% sicher sein kann, dass im gefährlichsten Monat (= Januar (blau)) nur noch in einen von 365 Tagen die Meldestufe 2 erreicht wird. Die nächst gefährlichen Monate sind Februar (rot), Dezember (gelb) und März (grün). Weitere Monate sind aufgrund der vorliegenden Daten eher bedeutungslos.
Stellt man die Aussagen nochmal auf rein statistische Basis, sind folgende drei Resultate hochsignifikant (Irrtum<10^-16):
Es gibt bei den Pegelständen Unterschiede zwischen den Monaten.
Es gibt prinzipiell eine Abnahme der Pegelstände über die Jahre.
Diese Abnahme ist in Abhängigkeit der Monate unterschiedlich stark ausgeprägt.
Mein Fazit
Die gefährlichen Monate für Hochwasser sind die Wintermonate. Allerdings hat das Eintreten solcher Ereignisse in Anzahl und Höhe während der letzten Jahrzehnte deutlich abgenommen, was im Bereich des Hochwasserrisikos eine gute Nachricht ist. Dies ist jedoch eine Trendinformation, die nichts über Einzelevents aussagt. So wurde im Februar 2021 der Pegel für die Meldestufe 2 über mehrere Tage deutlich überschritten.
Da die Pegelstände über die letzten Jahrzehnte spürbar zurückgegangen sind, drängt sich die Frage auf, ob die Nidder immer weniger Wasser führt. Dieser Frage gehe ich das nächste Mal nach. Wer sich interessiert, ob die Nidder auch eine Erwärmung spürt, kann sich in meinem vorherigen Beitrag informieren.
Commenti