
Grafana est votre cockpit d’observabilité : vous branchez des sources de données (métriques / logs / traces) et vous obtenez des dashboards lisibles, une exploration ad-hoc et des alertes. ➡️ Grafana ne stocke pas : il interroge des backends (Prometheus, Loki, Tempo, etc.) et affiche / alerte.
Quickstart en 2 minutes
Section intitulée « Quickstart en 2 minutes »Trois méthodes selon votre contexte. Docker convient au test local, Helm à Kubernetes, APT à un serveur dédié. Dans tous les cas, vous aurez Grafana accessible en moins de 2 minutes.
docker run -d \ --name grafana \ -p 3000:3000 \ -v grafana-data:/var/lib/grafana \ grafana/grafana-enterprise:12.3.2- Ouvrir
http://localhost:3000 - Login :
admin/admin(Grafana vous force à changer le mot de passe)
helm repo add grafana https://grafana.github.io/helm-chartshelm repo updatehelm install grafana grafana/grafana -n monitoring --create-namespaceMot de passe admin :
kubectl get secret -n monitoring grafana \ -o jsonpath="{.data.admin-password}" | base64 -dAccès (temporaire) :
kubectl port-forward -n monitoring svc/grafana 3000:80sudo apt install -y apt-transport-https software-properties-common wgetsudo mkdir -p /etc/apt/keyrings/wget -q -O - https://apt.grafana.com/gpg.key | gpg --dearmor \ | sudo tee /etc/apt/keyrings/grafana.gpg > /dev/null
echo "deb [signed-by=/etc/apt/keyrings/grafana.gpg] https://apt.grafana.com stable main" \ | sudo tee /etc/apt/sources.list.d/grafana.list
sudo apt updatesudo apt install -y grafanasudo systemctl enable --now grafana-serverAccès : http://localhost:3000
Ce que Grafana fait (et ce qu’il ne fait pas)
Section intitulée « Ce que Grafana fait (et ce qu’il ne fait pas) »Beaucoup de débutants pensent que Grafana “fait tout”. En réalité, Grafana est spécialisé dans l’affichage : il lit vos données, les rend visuelles, et vous alerte. Mais il ne collecte ni ne stocke rien.
| Grafana fait | Grafana ne fait pas |
|---|---|
| Dashboards (graphes, tables, stats, heatmaps) | Stockage des métriques/logs/traces |
| Explore (requêtes ad-hoc) | Collecte (exporters/agents) |
| Alerting (règles + routage + notifications) | Discovery / scraping à votre place |
Les 4 concepts à connaître (sinon tout paraît flou)
Section intitulée « Les 4 concepts à connaître (sinon tout paraît flou) »Si vous comprenez ces 4 objets, tout le reste devient logique. Inversement, sauter cette étape rend chaque action dans l’interface confuse.
Datasource
La connexion vers vos données. Sans datasource → pas de graphe.
Panel
Dashboard
Un écran composé de panels + variables. Il doit répondre à 1 question (ex: “mon cluster est-il OK ?”).
Alerting
Des règles + un routage + des contacts. Une alerte utile décrit un symptôme.
Obtenir de la valeur en 10 minutes
Section intitulée « Obtenir de la valeur en 10 minutes »Une fois Grafana installé, suivez ces 3 étapes pour passer de l’écran vide à un dashboard utile. L’objectif : avoir quelque chose à montrer en 10 minutes.
1) Ajouter une datasource (Prometheus en exemple)
Section intitulée « 1) Ajouter une datasource (Prometheus en exemple) »- Connections → Data sources → Add data source
- Choisir Prometheus
- URL :
http://prometheus:9090(adaptez à votre environnement) - Save & test
2) Importer un dashboard (le plus rapide)
Section intitulée « 2) Importer un dashboard (le plus rapide) »- Dashboards → Import
- Coller un ID (ex:
1860“Node Exporter Full”) - Sélectionner la datasource
- Import
3) Rendre le dashboard “utilisable” (sinon il reste décoratif)
Section intitulée « 3) Rendre le dashboard “utilisable” (sinon il reste décoratif) »- Ajoutez 1 variable : cluster ou instance
- Ajoutez 1 panel “symptôme” :
up, erreurs, latence… - Limitez les séries affichées (topk / agrégation) : sinon Grafana devient illisible
Alerting utile en 5 minutes (version débutant)
Section intitulée « Alerting utile en 5 minutes (version débutant) »Une alerte “CPU > 80%” brute spamme vite. Le minimum vital :
1 règle = 1 symptôme, 1 destination, un seuil raisonnable, un délai.
- Alerting → Contact points → Add contact point
- Configurez Email/Slack/Webhook
- Test
- Alerting → Alert rules → New alert rule
- Requête simple (exemple Prometheus) :
up == 0 - Condition : “IS ABOVE 0” pendant 2m
- Ajoutez
severity="critical"+team="platform" - Sauvegardez + vérifiez le routage
Cas d’usage (quand Grafana brille vraiment)
Section intitulée « Cas d’usage (quand Grafana brille vraiment) »Grafana s’adapte à de nombreux contextes. Voici les cas où il apporte le plus de valeur, avec les patterns de dashboards et d’alerting associés.
Kubernetes
Vues cluster / namespaces / workloads. Corrélation logs + métriques. Intégration native Prometheus Operator.
SRE / Infra
Les 4 “golden signals” : latence, erreurs, saturation, trafic. Dashboards serveurs, réseau, stockage.
Applications
Métriques RED/USE par service. Alerting orienté client. Traces + logs corrélés.
FinOps
Dashboards coûts cloud, usage par équipe, tendances et prévisions.
Les pièges qui rendent Grafana frustrant
Section intitulée « Les pièges qui rendent Grafana frustrant »Ces erreurs sont fréquentes et transforment Grafana en usine à gaz. La bonne nouvelle : chaque piège a un fix simple.
- Dashboard “fourre-tout” → personne ne le consulte. Fix : 1 dashboard = 1 question
- Trop de séries sur un panel → UI lente / illisible. Fix : agréger,
topk, limiter - Variables non bornées → timeouts. Fix : valeurs limitées, labels stables
- Alertes “seuils bruit” → spam. Fix : alerter sur symptômes (down, erreurs, latence)
- Pas de persistence → tout disparaît. Fix : volume Docker / PVC K8s
- Clicops en prod → non reproductible. Fix : provisioning YAML (dans la formation)
Checklist minimum avant production
Section intitulée « Checklist minimum avant production »Avant de déclarer Grafana “prêt pour la prod”, validez ces points. Un oubli coûte cher (données perdues, accès non sécurisé, dashboards non reproductibles).
- Persistence activée (volume/PVC)
- Mot de passe admin changé / désactivé via SSO
- HTTPS (Ingress / reverse proxy)
- RBAC (folders, rôles, accès)
- Backups testés (SQLite/PostgreSQL selon déploiement)
- 1 dashboard “overview” réellement utilisé
- 5–10 alertes max au départ (qualité > quantité)
Aller plus loin : tout est dans la formation
Section intitulée « Aller plus loin : tout est dans la formation »Cette page donne les bases. Pour maîtriser Grafana (création de dashboards, alerting avancé, provisioning GitOps), suivez la formation complète avec lab Kubernetes.
Ressources
Section intitulée « Ressources »Liens officiels pour approfondir ou résoudre un problème spécifique.
- Documentation Grafana : https://grafana.com/docs/grafana/latest/
- Installation Docker : https://grafana.com/docs/grafana/latest/setup-grafana/installation/docker/
- Installation Helm : https://grafana.com/docs/grafana/latest/setup-grafana/installation/helm/
- Dashboards communautaires : https://grafana.com/grafana/dashboards/
- Grafana Play (démo) : https://play.grafana.org/
- Releases : https://grafana.com/grafana/download