BOB-Server-Ausfall 02.12.2020

Wir haben gestern Vormittag ein größeres Systemupdate beim BOB-Server gemacht. Danach lief der Server und alle Services auch einwandfrei und wir hatten bei Tests keine Anzeichen für Unregelmäßigkeiten.

Gestern Abend (Mi., 02.12.) um ca. 20:30 Uhr hat unser notification-System zugeschlagen und gemeldet, dass der Server nicht erreichbar ist. Leider konnten wir uns auch remot nicht mehr Zugang verschaffen. Jetzt ist ein physikalischer Besuch angesagt. Wir schauen gerade (Danke an @Diren!) was los ist und hoffen, dass ein reboot das Teil wieder zum Leben erweckt.

Ob der Ausfall mit dem Systemupdate zu tun hat können wir gerade nicht sagen. Wir nutzen den Server auch für Statistikpakete, die die Sensordaten auswerten, da gab es gestern Abend ein Problem, ggf. sind es zwei unabhängige Ereignisse und das update hat mit dem Ausfall nichts zu tun.

Leider wurden mit der Nicht-Erreichbarkeit alle von den nodes geschickten Messwerte ab dem Serverausfall nicht gespeichert. Sorry!

Der Server nebst Datenannahme läuft wieder!

Was war denn das Problem?

Ich fühl mich mal so frei, wo ich ja zumindest den kleinen Feiertag anregte:

Gestern war Update-Tag. Oder auch: Guckt nach nem Kernel-Update immer besser nochmal nach ob sich nicht eventuell die Namen Eurer Netzwerk-Interface änderten. (Aber in der Config nicht.)

1 Like