Da die angebotenen Dienste immer intensiver genutzt werden, wollen wir sie auch ordentlich überwachen. Wir überprüfen ab sofort dauerhaft, ob von bestimmten Referenzdatenquellen regelmäßig Meßwerte geliefert, ordentlich abgespeichert und wieder ausgegeben werden können. Dabei wird also die komplette Telemetriekette vom Sensorknoten bis zur Datenerfassungsmaschinerie im Backend berücksichtigt.
Sensoren
Um die Funktionsfähigkeit unserer Systeme zu prüfen, haben wir als Referenzdatenquellen zwei besonders zuverlässige Übermittler ausgewählt. Das sind:
Als Nebeneffekt können wir damit nun auch sehr leicht weitere individuelle Datenkanäle überwachen. Wenn Ihr also wissen wollt, ob es Euren Sensorknoten gut geht, schalten wir Euch gerne einen entsprechenden Sensor auf Euren Datenkanal auf.
Erst einmal Danke für “zuverlässige Übermittler”. :-) Naja, eigentlich sollte es nur ein temporäres System sein, das die Batterie-Lebensdauer eines ESP8266 auszutestet …
Und da hat unser neues Selbsttest-System jetzt gute Dienste geleistet. Probleme, sprich ausbleibende Datenpakete werden per E-Mail gemeldet (im subject “Problem”). Aber auch wenn der Datenfluss wieder startet bekommt man eine Mail mit “Recovery” im Titel.
Es gab Anfang April mal einen Aussetzer, da fehlte eine Messung, ggf. war der WLAN-AP nicht verfügbar oder im Netz gabe es eine Störung. Dann ab 25.04. kam es immer wieder zu Ausfällen, d.h. ca. 1 Stunde nach dem letzten Datenpaket kam kein neues an und damit wird die Warn-Mail getriggert. Wenn der Datenfluss wieder einsetzt gibt es eine Recovery-Meldung.
Am Anfang sind es nur einzelne Datenpakete, die nicht gesendet werden. Dann mit weiter sinkender Spannung fehlt immer mehr.
Auch in den Daten sieht man, dass es mit dem Strom zu Ende geht. Der DHT setzt ab einer zu geringen Spannung aus, naja und WLAN ist dann auch schwierig, wie man an den fehlenden Datenpaketen sieht.
Ich habe nun endlich einmal die entsprechenden Selbsttest-Sensoren überarbeitet und die Datenkanäle von @clemens und @einsiedlerkrebs rausgeworfen, weil die nun schon länger keine Daten mehr übermittelten. Schade!
Dafür werden nun von den folgenden Datenkanälen Proben genommen. Herzlichen Dank an @Thias, @wtf, @peterthiemer und @tonke für den stabilen Betrieb ihrer Datenlogger und Wetterstationen, die diese Datenkanäle speisen.
Momentan sind die Sensoren so eingestellt, dass “nach einer Stunde keine Daten” die Warnlampe angeht und “nach einem ganzen Tag keine Daten” in den Fehlerzustand gewechselt wird. Sagt gern Bescheid, wenn Ihr von dem ein oder anderen Sensor entsprechende Benachrichtigungen per E-Mail erhalten wollt bzw. natürlich genauso, wenn Ihr Euch weitere Sensoren auf anderen Datenkanälen wünscht.
War ich zu vorschnell, auch diesen als Indikator dafür heranzuziehen, ob das System insgesamt funktionabel ist? => Lieber wieder rausnehmen, oder das Prüfintervall verlängern?
Hi Andreas,
nimm lieber nur freiland_hive1, die Einheit hat sich als stabiler erwiesen. Der Ausfall von Hive 2 begann mit einem Upgrade im TTN Backend. Seit ich den Node gestern resettet habe, kommen auch wieder Daten an. Prinziell aber bin ich recht dicht an Datenlücken dran und kann mich meist innerhalb von ein paar Tagen um Telemetrieausfälle kümmern.