Les outils d’alerting et de gestion d’incidents forment le dernier maillon de la chaîne d’observabilité : ils transforment les signaux détectés en actions humaines. Sans eux, vos dashboards ne servent qu’après coup. Avec eux, les bonnes personnes sont notifiées au bon moment, avec le contexte nécessaire pour agir.
Matrice de choix
Section intitulée « Matrice de choix »| Critère | Alertmanager | Grafana OnCall | PagerDuty |
|---|---|---|---|
| Scope | Alerting pur | Alerting + astreintes | Plateforme complète |
| Intégration | Prometheus natif | Grafana natif | Multi-sources |
| Calendriers | Non | Oui | Oui |
| Escalades | Basiques | Avancées | Très avancées |
| Coût | Gratuit | Gratuit (OSS) | Payant |
| Complexité | Faible | Modérée | Élevée |
Outils dans cette catégorie
Section intitulée « Outils dans cette catégorie » Alertmanager Gestionnaire d'alertes Prometheus : routage, grouping, silences, inhibitions
Guides associés
Section intitulée « Guides associés » Alerting efficace Symptom-first, burn rate, sévérité — concevoir des alertes qui comptent
Runbooks et incidents Structurer la réponse aux incidents : rôles, runbooks, postmortems