Ausfall der Datenannahme am 1. Oktober 2018 um 06:53 Uhr

Auch heute Morgen hat der Mosquitto Dienst wieder seinen Geist aufgegeben. Da spätestens nun ein eindeutiges Muster bei den Ausfällen zu erkennen ist, siehe

waren wir halb in Alarmbereitschaft und konnten den Dienst um 07:35 Uhr wieder entstören.

Die Überwachung per Monit hat den Ausfall zwar festgestellt, der Mechanismus zum automatischen Neustart hat jedoch versagt. Schade! Für die Unannehmlichkeiten bitten wir um Entschuldigung.

Wir hoffen, dass ein neues Mosquitto Release (siehe Ausfall der Datenannahme am 1. September 2018 um 06:52 Uhr ff.) Abhilfe bringt.

Note to self: Vermutlich liegt es auch irgendwie an der Logfilerotation, ich hatte da etwas bei den Issues von Mosquitto aufgeschnappt:


Unsere aktuelle logrotate Konfiguration /etc/logrotate.d/mosquitto ist:

/var/log/mosquitto/mosquitto.log {
        rotate 7
        daily
        compress
        size 100k
        nocreate
        missingok
        postrotate
                /usr/bin/killall -HUP mosquitto
        endscript
}

Heute Morgen wurde jedoch anscheinend nicht rotiert, zumindest nicht erfolgreich:

root@elbanco:~# l /var/log/mosquitto/mosquitto.log
mosquitto mosquitto 261902 Oct  1 12:29 /var/log/mosquitto/mosquitto.log

Wir werden sehen, ob ein Upgrade auf das kürzlich veröffentlichte Mosquitto 1.5.3 für Abhilfe sorgt, ansonsten und unabhängig davon steht auch ein Systemupgrade auf Debian GNU/Linux 9 (stretch) an.

On "eltiempo" after going with https://mosquitto.org/blog/2013/01/mosquitto-debian-repository/:

1538402658: mosquitto version 1.4.10 terminating
1538402658: mosquitto version 1.5.3 starting
1 Like

Now also on "elbanco":

1538429581: mosquitto version 1.5 terminating
1538429586: mosquitto version 1.5.3 starting

The thing we probably have been experiencing was this issue, which had apparently been fixed with Mosquitto 1.5.2 already:



On top of that, another important update arrived through Mosquitto 1.5.3: