aboutsummaryrefslogtreecommitdiff
diff options
context:
space:
mode:
authorAlex Auvolat <alex@adnab.me>2022-12-23 00:19:17 +0100
committerAlex Auvolat <alex@adnab.me>2022-12-23 00:19:17 +0100
commit64e15db942fdf33f6ff02f44f66e56fd677bd1a9 (patch)
treeb5b4241038a5990f86a4d2cb1aac52f0c3cf7e0e
parent8ccc21468bfcf03a23b73dfd36a79aa74f7d5e76 (diff)
downloadguide.deuxfleurs.fr-64e15db942fdf33f6ff02f44f66e56fd677bd1a9.tar.gz
guide.deuxfleurs.fr-64e15db942fdf33f6ff02f44f66e56fd677bd1a9.zip
Panne backups et préemption
-rw-r--r--content/operations/pannes/petits-incidents.md4
1 files changed, 4 insertions, 0 deletions
diff --git a/content/operations/pannes/petits-incidents.md b/content/operations/pannes/petits-incidents.md
index 99e389d..658757f 100644
--- a/content/operations/pannes/petits-incidents.md
+++ b/content/operations/pannes/petits-incidents.md
@@ -21,3 +21,7 @@ weight = 1000
- **2022-03-28:** Grafana (hébergé par M) n'est pas disponible. M est le seul à pouvoir intervenir.
*Actions à envisager:* cartographier l'infra de monitoring et s'assurer que plusieurs personnes ont les accès.
+
+- **2022-12-23:** Les backups de la production ne s'effectuaient pas correctement car Nomad ne voulait pas lancer les jobs pour cause de ressources épuisées (pas assez de CPU).
+
+ *Action menée:* La préemption des jobs a été activée pour tous les schedulers Nomad, ce qui permet aux jobs de backup de virer les jobs de plus faible priorité pour pouvoir se lancer (ces derniers seront relancés sur une autre machine automatiquement).