Aller au contenu

Monitoring des machines Linux avec Prometheus

logo prometheus

Mon Home Lab Devops est composé à ce jour de 3 mini-pc dont un se fige de temps en temps (le plus vieux). J’ai donc mis en place le monitoring de leurs ressources avec Prometheus. Le plus compliqué a été de trouver où ajouter dans le fichier de valeurs du chart helm ces jobs de scraping. Mais avant cela voyons comment installer node-exporter sur les machines Linux.

Installation de prometheus-node-exporter sur les machines Linux

Pour installer node-exporter, il faudra tout installer à la main.

Terminal window
sudo useradd -rs /bin/false node_exporter
wget https://github.com/prometheus/node_exporter/releases/download/v1.3.1/node_exporter-1.3.1.linux-amd64.tar.gz
sudo tar -xzvf node_exporter-1.3.1.linux-amd64.tar.gz
sudo install node_exporter-1.3.1.linux-amd64/node_exporter /usr/local/bin
sudo vi /etc/systemd/system/node_exporter.service

Mettez-y ce contenu :

[Unit]
Description=Node Exporter
[Service]
User=node_exporter
EnvironmentFile=/etc/sysconfig/node_exporter
ExecStart=/usr/local/bin/node_exporter $OPTIONS
[Install]
WantedBy=multi-user.target

Il faut aussi créer le fichier de configuration :

Terminal window
sudo mkdir -p /etc/sysconfig/
sudo vi /etc/sysconfig/node_exporter

Y mettre ce contenu :

OPTIONS="--collector.textfile.directory /var/lib/node_exporter/textfile_collector"

On active et on démarre le service :

Terminal window
sudo systemctl enable node_exporter.service --now

Ajout des jobs de scraping des machines Linux à la configuration de Prometheus

Si comme moi vous avez installé la stack Prometheus/Grafana avec le helm chart, il faut ajouter au fichier de valeurs ceci :

additionalScrapeConfigs:
- job_name: devbox2
scrape_interval: 30s
static_configs:
- targets:
- 192.168.1.103:9100
labels:
env: 'production'
app: 'rundeck'
- job_name: devbox3
scrape_interval: 30s
static_configs:
- targets:
- 192.168.1.41:9100
labels:
env: 'production'
app: 'test'

On upgrade notre release Helm :

Terminal window
export KUBECONFIG=~/.kube/config-devbox1.yml
kubectl config set-context --current --namespace=prometheus
helm upgrade prometheus prometheus-community/kube-prometheus-stack -f my-values.yml
Release "prometheus" has been upgraded. Happy Helming!
NAME: prometheus
LAST DEPLOYED: Thu Mar 10 12:54:50 2022
NAMESPACE: prometheus
STATUS: deployed
REVISION: 6
NOTES:
kube-prometheus-stack has been installed. Check its status by running:
kubectl --namespace prometheus get pods -l "release=prometheus"
Visit https://github.com/prometheus-operator/kube-prometheus for instructions on how to create & configure Alertmanager and Prometheus instances using the Operator.

Maintenant, il suffit d’aller faire un tour sur le dashboard de Prometheus. Vous devriez voir apparaître vos machines Linux (il faut patienter une petite minute pour les voir apparaître).

prometheus node export linux

Si vous n’avez créé l’ingress le voila :

apiVersion: networking.k8s.io/v1
kind: Ingress
metadata:
annotations:
kubernetes.io/ingress.class: traefik
traefik.ingress.kubernetes.io/frontend-entry-points: http,https
traefik.ingress.kubernetes.io/redirect-entry-point: https
traefik.ingress.kubernetes.io/redirect-permanent: "true"
name: prometheus-ingress
namespace: prometheus
spec:
rules:
- host: prometheus.robert.local
http:
paths:
- path: /
pathType: Prefix
backend:
service:
name: prometheus-operated
port:
number: 9090
tls:
- hosts:
- prometheus.robert.local
secretName: wildcard-tls-cert

Maintenant, allons voir dans le dashboard node-exporter Full de Grafana si nos nœuds sont présents. Oui, ils le sont.

grafana node export linux