SLURM (Simple Linux Utility for Resource Management) est un planificateur de tâches gratuit et open source pour les noyaux de type Linux et Unix, utilisé par de nombreux superordinateurs et grappes d’ordinateurs dans le monde.
Commandes de base
File d’attente = queue = partition dans SLURM
Commande | Définition |
---|---|
sinfo |
interrogation des files d’attente |
sbatch |
soumission d’un job dans une file d’attente (appelées partitions dans SLURM) |
salloc |
réservation de ressources en interactif |
srun |
crée une allocation de ressources, à utiliser avec sbatch ou salloc run parallel jobs |
scancel |
suppression d’un job |
squeue |
liste des jobs dans les files d’attente |
sprio |
prorités relatives des jobs en attente |
scontrol |
affiche/modifie des données relatives aux tâches : jobs, nodes, partitions, reservations, etc. |
seff |
affiche l’efficatité d’un job terminé |
sacct |
affiche les données des jobs |
sacctmgr |
affiche et modifie les informations des comptes Slurm |
sattach |
attach to a running job step |
sdiag |
display scheduling statistics and timing parameters |
sreport |
generate canned reports from job accounting data and machine utilization statistics |
sshare |
display the shares and usage for each charge account and user |
sstat |
display process statistics of a running job/step |
sview |
a graphical tool for displaying jobs, partitions, reservations, and Blue Gene block |
sbcast |
transmit a file to the nodes allocated to a Slurm job. |
scrontab |
manage Slurm crontab files |
sh5util |
merge utility for acct_gather_profile plugin. |
slurm |
Slurm system overview |
strigger |
used to set, get or clear Slurm trigger information. |
Commande scontrol
Affiche tous les nodes en détails :
$ scontrol show nodes |
Lorsqu’un noeud n’est pas géré par SLURM il sera en Not responding
:
[...] |
Géré par SLURM avec 1 erreur :
NodeName=MyNode42 Arch=x86_64 CoresPerSocket=30 |
Commande sinfo
Magik option : Indique quels noeuds est sous gestion SGE ou SLURM (sous réserve de l’avoir précisé)
# sinfo –Nel |
Documentation
https://pmcs2i.ec-lyon.fr/documentation/run/commands.html
https://hpc.llnl.gov/banks-jobs/running-jobs/slurm-commands
https://slurm.schedmd.com/man_index.html