Für die kommende Saison bekommt das Thema rund um den langgehegten Wunsch, phänologische Daten im System zu haben und z.B. für Annotationen im Grafana oder Benachrichtigungen an die Imker verwenden zu können, wieder einmal etwas Aufmerksamkeit.
Wir sind ein wenig in die Details der vom DWD erhobenen Daten eingestiegen und haben uns einen Plan zurechtgelegt.
Normalerweise orientieren sich die Imker am sogenannten “langjährigen Mittel”, wie das genau berechnet wird und wie viele Jahre dafür zurückgezählt wird weiß ich nicht. Ggf. können wir das aus den oben verlinkten Daten berechnen, oder es gibt genau dafür Referenzwerte, z.B. Start der Apfelblüte oder Start der Winterlindenblüte usw. Das sind Daten, die für den Imker sehr spannend sind, da er sich nicht nach dem Kalender richtet, z.B. Honigraum aufsetzen: 1. April, sondern nach der Natur. Hier ist etwa die Zeigerpflanze die Kirsche. Mit der Kirschblüte soll aufgesetzt werden.
Schön wäre, wenn wir diese Daten als annotations in Grafana hätten und diese dann als Datenreihe - je nach Bedarf - mit in ein Diagramm einblenden könnten.
Im Bereich annual_reporters gehen wir ins für uns interessante Verzeichnis “fruit”. Dort gibt es wieder “historical” und “recent”. “Recent” scheinen die Daten ab 2015 zu sein, “historical” die von 1951 bis 2015 bzw. 1991. Aprikose z.B. gibt es nur historisch bis 1991, nicht aber “recent”. Schauen wir ins Verzeichnis “recent”: In der Beschreibung sehen wir einen Link, der erklärt was die Phase_id ist
Für uns ist “5;Blüte Beginn” oder auch “6;Vollblüte” und “7;Blüte” Ende interessant.
Schauen wir nun in die eigentlichen Daten an. Die Datensätze sind nach Pflanzenart verfügbar, z.B. frühe, späte Äpfel, … Wir interessieren uns nun exemplarisch für die PH_Jahresmelder_Obst_Suesskirsche_fruehe_Reife_akt.txt
Nach dem Import z.B. in Excel (";" als Datentrennzeichen) müssen wir ggf. noch das Datum in Spalte F von JJJJMMTT Excel-Kompatibel machen. Nun können wir nach a) Phase_id und darunter nach b) Eintrittsdatum sortieren. Nun können wir den Mittelwert für die Phase “5” im Jahr 2015, 2016 und 2017 berechnen. Für die Jahre 2015 und 2016 ist der mittlere Begin der frühen Süßkirschblüte der 17.04., 2017 war es deutlich früher, nämlich am 06.04.
Wenn wir nun herausfinden was das “langjährige Mittel” offiziell ist könnten wir die Daten jährlich neu aus den öffentlich zugänglichen Daten berechnen und als annotations für unsere Graphen verfügbar machen.
Der mittlere Blühbeginn auch nach Bundesland. Allerdings nicht als Rohdatenformat, sondern in den verschiedenen Grafiken als Mittelwertslinie eingezeichnet. Man müsste sich zur Weiternutzung also alle Diagramme anschauen, die Mittelwerte händisch rausschreiben und das dann für alle 16 Bundesländer … unschön.
Leider nicht, das sind nur die Daten des aktuellen Jahres bzw. wenn etwas die Apfelblüte bis zum aktuellen Datum noch nicht dran war die Daten des letzten Jahres. Ich möchte das “langjährige Mittel” der Apfel-/Kirsch/-xy-Blüte im besten Fall noch pro Bundesland.
Jein, die aktuellen Daten kommen ja immer step by step rein. und wie man sieht “verfälscht” ein unvollständiger Satz ja auch die Daten. Sprich, wenn die Halseblüte gerade angefangen hat, ist der Mittelwert der Meldungen fürs aktuelle Jahr nach vorne verschoben, man muss somit für vergleichbare Werte warten bis die Meldungen abgeschlossen sind. Dann ist das Ereignist “Blühbeginn” aber schon vorbei. Wenn du den Startpunkt nimmst und laufende Meldungen “im Prozess” aufnimmst musst du die aber auch täglich wieder aktualisieren, da sehe ich momentan ohne Schnittstelle vom DWD, keine praktikablen Möglichkeiten.
Leider noch nicht, aber nach dem Aufmöbeln der Grundfunktionalität können wir langsam daran denken, diese als neue Datenquelle zu erschließen.
Unabhängig davon könnten wir uns schon einmal Gedanken über die Berechnung des Mittelwerts von mehreren Datumsangaben machen. Als Denkanstoß haben wir folgendes zusammengetragen:
Im Prinzip ist es das, allerdings ist der Median nicht das richtige Maß, das wir brauchen, sondern der Mittelwert. Median ist - wie bei dir korrekt berechnet - der 23.05.2015, wir benötigen aber das arithmetische Mittel, das wäre der 31.05.2015.
Versuche einmal zu skizzieren wie eine Lösung aussehen könnte
Import der Daten vom DWD-Server
– Beobachtungsdaten pro Frucht
– Datensätze der Standorte
ggf. Anpassung / Konvertierung der Daten, z.B. Zahlenformat
Anreicherung der Beobachtungsdaten mit Geodaten, d.h.
– über die Standort-ID Längen- und Breitengrad in Datensatz 2 ermitteln
– dies in Datensatz 1 hinzufügen
– über die Geodaten Bundesland oder Regierungsbezirk, … bestimmen
Datums-Mittel berechnen (arithm. Mittel / mean) pro Bundesland pro Frucht für Phasen-ID “5”
als annotation pro Bundesland je für alle relevanten Zeigerpflanzen / Frucht bei Grafana zur Verfügung stellen.
Fände ich eigentlich auch Sinnvoll. Also beides. Von der jetzigen Natur der Darstellung im Grafana ist es ja eher selten so, dass man in die Zukunft hinaus zoomt. Will sagen, dass die Annotation gar nicht sichbar ist, solange man nicht dort hin zoomt.
Dennoch ist es natürlich total sinnvoll darüber Bescheid zu wissen.
Hab mich gestern mit Andreas unterhalten, am schönsten wäre es, man würde sich bei dem Phänologischen Vorraussage an dem SunMoon plugin orientieren insofern, dass die Graphen eine (von jahr zu Jahr bereinigte) Funktion als Grundlage haben.
Sobald aber der Zeitpunkt gekommen ist, dass eine Blüte begonnen hat, würde man sich eigentlich den tatsächlichen Zeitpunkt in den Daten wünschen um dort dann auch das Verhalten der Bienen damit korrelieren lassen zu können, bzw. den Honig zu bestimmen ;). Oder?
So weit ich mit entsinne haben wir nicht für alle Pflanzen den kompletten Blütenzyklus von Blühbeginn bis Ende Blüte, daher werden wir das vermutlich nicht brauchen können.
Noch eine Frage dazu. Die Daten sollen ja parallel mit den Stockdaten in Grafana landen, dann bringt uns vis.js Co. ja nichts, oder?
Es wäre eine alternative Darstellungsform, die für den Anfang deutlich leichter zu erschließen ist als die Integration in Grafana, sobald wir die Daten in der entsprechenden Form vorliegen haben.
Als reguläre Annotationen lassen sich die Zeitpunkte natürlich bereits einfach eintragen. Unser langfristiger Wunsch, die Daten über ein Addon à la Sun and Moon datasource im Grafana zur Verfügung zu stellen, erfordert jedoch deutlich mehr Aufwand.