Loxberry icon indicating copy to clipboard operation
Loxberry copied to clipboard

Watchdog: Überwachung von Health Checks

Open mschlenstedt opened this issue 3 years ago • 2 comments

Der in LoxBerry bereits integrierte Watchdog soll erweitert werden, sodass optional auch die Healthchecks zur Überwachung des Systems verwendet werden können und bei Fehlfunktion ggf. einen Reboot auslösen können.

Idee: User wählt bei den Healthchecks aus, welcher Healthcheck einen Reboot auslösen kann. Voraussetzung: Healthchecks sind im Watchdog Widget aktiviert

Realisierung über die Watchdog test&repair Funktion: https://www.crawford-space.co.uk/old_psc/watchdog/watchdog-test-repair-scripts.html

So kann zunächst geprüft werden, ob die Funktion repariert werden kann (z. B. Neustart des Daemons). Erst im Fehlerfall wird ein Neustart durchgeführt.

Vor dem Neustart sollen zur Diagnose alle Logfiles auf die SD-Karte gesichert werden.

Anwendungsbeispiele wären kritische Loxberrys, auf denen z. B. Bussysteme fürs Smarthome laufen (1-Wire, Loxmatic, MQTT Gateway).

mschlenstedt avatar Jan 06 '22 19:01 mschlenstedt

Umhängen des Watchdogs zum Healthcheck?

mschlenstedt avatar Jan 07 '22 09:01 mschlenstedt

Nach ersten Tests: Umsetzung ist kompliziert. Eventuell Realisierung später, wenn weiterhin noch Bedarf besteht.

mschlenstedt avatar Sep 21 '22 07:09 mschlenstedt