Alerting & incidents

Les outils d’alerting et de gestion d’incidents forment le dernier maillon de la chaîne d’observabilité : ils transforment les signaux détectés en actions humaines. Sans eux, vos dashboards ne servent qu’après coup. Avec eux, les bonnes personnes sont notifiées au bon moment, avec le contexte nécessaire pour agir.

Matrice de choix

Critère	Alertmanager	Grafana OnCall	PagerDuty
Scope	Alerting pur	Alerting + astreintes	Plateforme complète
Intégration	Prometheus natif	Grafana natif	Multi-sources
Calendriers	Non	Oui	Oui
Escalades	Basiques	Avancées	Très avancées
Coût	Gratuit	Gratuit (OSS)	Payant
Complexité	Faible	Modérée	Élevée

Outils dans cette catégorie

Alertmanager Gestionnaire d'alertes Prometheus : routage, grouping, silences, inhibitions

Guides associés

Alerting efficace Symptom-first, burn rate, sévérité — concevoir des alertes qui comptent

Runbooks et incidents Structurer la réponse aux incidents : rôles, runbooks, postmortems