Vous voulez mettre en place une stack d’observabilité, mais face à la jungle des outils — Prometheus, Grafana, Loki, Tempo, OTel Collector, Vector, Jaeger, Mimir, VictoriaMetrics — vous ne savez pas par où commencer ni comment les assembler. Ce hub vous guide : chaque outil est classé par fonction dans le pipeline d’observabilité, avec des fiches qui expliquent quand et pourquoi l’utiliser, pas juste comment l’installer.
Choisir vite selon votre besoin
Section intitulée « Choisir vite selon votre besoin »Je débute, je veux une stack simple
Grafana + Prometheus + Loki = le trio éprouvé. Ajoutez Tempo si vous avez besoin de traces. → Prometheus → Grafana → Loki
Je veux corréler logs, métriques et traces
OpenTelemetry unifie l’instrumentation. Utilisez le Collector comme point central, puis routez vers vos backends. → OpenTelemetry Collector → Corrélation (fondamentaux)
Je déploie sur Kubernetes
kube-state-metrics + node-exporter = métriques cluster. Ajoutez Promtail ou OTel Collector pour les logs, Tempo pour les traces. → Kubernetes
Je veux centraliser mes logs
Loki si vous utilisez déjà Grafana (léger, labels). OpenSearch (ex-ELK) pour le full-text avancé et les cas compliance. → Logs
Je veux du monitoring synthétique
Uptime Kuma pour les checks basiques (auto-hébergé). k6 pour les tests de charge et scénarios complexes. → Synthetics & RUM
Je veux gérer les astreintes
Alertmanager si vous êtes full Prometheus. Grafana OnCall pour une gestion plus riche (escalades, calendriers, intégrations). → Alerting & incidents
Le pipeline d’observabilité
Section intitulée « Le pipeline d’observabilité »Les outils s’organisent en étapes successives. Comprendre ce pipeline aide à choisir et à assembler une stack cohérente :
Application → Instrumentation → Collecte → Backend → Visualisation → Alerting → Incident (SDK) (Collector) (TSDB) (Grafana) (Alertmanager) (OnCall)| Étape | Rôle | Outils typiques |
|---|---|---|
| Instrumentation | Générer les signaux (métriques, logs, traces) dans l’application | SDK OTel, bibliothèques de métriques |
| Collecte & pipeline | Agréger, filtrer, router les signaux | OTel Collector, Vector, Fluent Bit, Promtail |
| Backend métriques | Stocker/interroger les métriques | Prometheus, Mimir, VictoriaMetrics |
| Backend logs | Stocker/interroger les logs | Loki, OpenSearch, rsyslog |
| Backend traces | Stocker/interroger les traces | Tempo, Jaeger |
| Visualisation | Dashboards, exploration | Grafana |
| Alerting | Déclencher des notifications | Alertmanager, Grafana Alerting |
| Incidents | Gérer les astreintes, escalades | Grafana OnCall, PagerDuty |
| Synthetics | Checks externes, tests de charge | Uptime Kuma, k6 |
Explorer par catégorie
Section intitulée « Explorer par catégorie »Guides pratiques associés
Section intitulée « Guides pratiques associés »Les fiches outils vous disent quoi utiliser. Les guides pratiques vous disent comment bien l’utiliser :
À retenir
Section intitulée « À retenir »- Choisissez vos outils par fonction dans le pipeline, pas par popularité
- Commencez simple (Prometheus + Grafana + Loki) puis ajoutez selon vos besoins
- L’instrumentation (OTel) est le fondement — sans données de qualité, les meilleurs outils sont inutiles
- Un collecteur central (OTel Collector, Vector) simplifie la gestion à grande échelle