infrastructure icon indicating copy to clipboard operation
infrastructure copied to clipboard

alarme lorsque munin n'arrive pas à joindre une destination

Open Marc-marc-marc opened this issue 2 years ago • 3 comments

Les graphes munin ne se mettaient plus à jour, donc pas de rouge dans le tableau d'alarme. C'est l'IPv6 qui ne routait plus. Y aurait-il un moyen pour détecter les host/vm injoignables par munin et les remonter d'une façon ou d'une autre en alarme ?

Originally posted by @cquest in https://github.com/osm-fr/infrastructure/issues/438#issuecomment-1518686823

Marc-marc-marc avatar Apr 26 '23 14:04 Marc-marc-marc

techniquement oui mais je doute de la pertinance vu la 100aine d'alerte pas jour, volume ingérable. mais j'en fais un ticket si quelqu'un ssouhaite coder l'alarme vu que cela te semble utile

Marc-marc-marc avatar Apr 26 '23 14:04 Marc-marc-marc

Je verrai bien tout en rouge sur les hosts/VM injoignables sur le dashboard principal, car oui, les alertes par mail c'est ingérable vue leur granularité.

Si le mail d'alerte sortait au bout de N erreurs, ça serait plus gérable.

cquest avatar Apr 28 '23 10:04 cquest

Je verrai bien tout en rouge sur les hosts/VM injoignables sur le dashboard principal, car oui, les alertes par mail c'est ingérable vue leur granularité.

je ne connais aucune option de ce genre dans munin, cela nécessiterait d'écrire plus de code qu'une simple alerte

Si le mail d'alerte sortait au bout de N erreurs, ça serait plus gérable.

c'est une possibilité en effet

Marc-marc-marc avatar Apr 29 '23 22:04 Marc-marc-marc