Outils pour utilisateurs

Outils du site


adrien_khokholkoff:prometheus:alerting

Différences

Ci-dessous, les différences entre deux révisions de la page.

Lien vers cette vue comparative

Prochaine révision
Révision précédente
adrien_khokholkoff:prometheus:alerting [2018/05/30 14:22]
Adrien Khokholkoff créée
adrien_khokholkoff:prometheus:alerting [2018/06/01 14:37] (Version actuelle)
Adrien Khokholkoff [Configuration basique]
Ligne 22: Ligne 22:
 Pour se faire, il va d'​abord falloir créer un fichier qui permettra de mettre en place toutes les règles qui seront récupérées par Prometheus. Le fonctionnement est semblable au fichier qui a été créé afin de faire fonctionner Prometheus. Tout d'​abord,​ il va falloir créer un fichier dans lequel on va stocker nos alertes que l'on nommera de la manière que l'on veut (par exemple xxx.alerts.yml). ​ Pour se faire, il va d'​abord falloir créer un fichier qui permettra de mettre en place toutes les règles qui seront récupérées par Prometheus. Le fonctionnement est semblable au fichier qui a été créé afin de faire fonctionner Prometheus. Tout d'​abord,​ il va falloir créer un fichier dans lequel on va stocker nos alertes que l'on nommera de la manière que l'on veut (par exemple xxx.alerts.yml). ​
  
-Placé ​ce dernier au même endroit que celui pour Prometheus permettra de plus facilement configurer le système d'​alertes,​ puisqu'​il ne sera pas nécessaire d'​indiquer le chemin complet pour accéder à ce dernier, mais uniquement son nom. Afin que Prometheus détecte ce dernier, il suffit d'​ajouter dans le fichier xxx.yml les lignes suivantes :+Il faut ensuite placer ​ce dernier au même endroit que celui pour Prometheus permettra de plus facilement configurer le système d'​alertes,​ puisqu'​il ne sera pas nécessaire d'​indiquer le chemin complet pour accéder à ce dernier, mais uniquement son nom. Afin que Prometheus détecte ce dernier, il suffit d'​ajouter dans le fichier xxx.yml les lignes suivantes :
  
   rule_files:   rule_files:
Ligne 29: Ligne 29:
 Une fois ceci fait, il faudra rajouter des alertes dans ce fichier. En fonction des alertes voulues, le fichier variera. C'est pour cette raison qu'il peut être compliqué au premier abord. A l'aide de la documentation officielle de Prometheus (que l'on peut retrouver [[https://​prometheus.io/​docs/​prometheus/​latest/​configuration/​alerting_rules|ici]]). Une fois ceci fait, il faudra rajouter des alertes dans ce fichier. En fonction des alertes voulues, le fichier variera. C'est pour cette raison qu'il peut être compliqué au premier abord. A l'aide de la documentation officielle de Prometheus (que l'on peut retrouver [[https://​prometheus.io/​docs/​prometheus/​latest/​configuration/​alerting_rules|ici]]).
  
 +Chaque paramètre est un point très important de la configuration des alertes, c'est pour cette raison qu'il faut bien comprendre à quoi chacun correspond avant d'y apporter des modifications. On retrouve notamment les variables suivantes :
  
 +  alert: xxx (qui représente le nom que l'on veut donner à l'​alerte. Lors de la réception d'un mail ou d'un message dans un chat par exemple, il sera indiqué clairement d'où provient le problème et donc facilement et rapidement dépanner)
 +  expr: xxx < xxx (le paramètre qui déclenchera l'​alerte si la condition est respectée, c'est à dire dans le cas si la variable que l'on indique est inférieur à la valeur que l'on a indiqué)
 +  for: xxm (le temps d'​attendre avant de considérer que l'​alerte doit être envoyé. Ce paramètre permet notamment d'​éviter de recevoir une alerte pour une défaillance qui n'a durée que quelques secondes. Le temps indiqué peut être en secondes(s),​ en minutes(m) en fonction de ce qui est indiqué)
 +  ​
 +Cela permet donc de configurer les alertes sur Prometheus. Cependant, les alertes ne seront pas envoyées automatiquement par mail, par SMS ou même par un chat. Pour cela, il faudra installer et configurer un outil extérieur que l'on intégrera dans Prometheus et qui s'​appelle "​Alertmanager"​.
  
 +**Pour créer une alerte autour de l'​utilisation du CPU d'une machine, la variable node_cpu qui était utilisée auparavant a été renommé et s'​appelle désormais node_cpu_seconds_total. Cela peut notamment poser problème lors de l'​utilisation de dashboards prefait sur Grafana qui n'a pas encore mis à jour ces variables. Pour ce qui est des autres valeurs, il est récurrent que les metrics affichées par Grafana, les variables utilisées ne soient pas bonnes et qu'il manque "​_bytes"​ ou encore "​_total"​ afin de pouvoir afficher les graphiques correctement.**
  
 +La configuration d'​Alertmanager étant une étape à part, une nouvelle [[.:​alerting:​alertmanager|page]] sera créée expliquant les différentes étapes à suivre afin de mettre en place cet outil.
adrien_khokholkoff/prometheus/alerting.1527682941.txt.gz · Dernière modification: 2018/05/30 14:22 par Adrien Khokholkoff