SLURM - Commandes de base

SLURM (Simple Linux Utility for Resource Management) est un planificateur de tâches gratuit et open source pour les noyaux de type Linux et Unix, utilisé par de nombreux superordinateurs et grappes d’ordinateurs dans le monde.

Commandes de base

File d’attente = queue = partition dans SLURM

Commande Définition
sinfo interrogation des files d’attente
sbatch soumission d’un job dans une file d’attente (appelées partitions dans SLURM)
salloc réservation de ressources en interactif
srun crée une allocation de ressources, à utiliser avec sbatch ou salloc run parallel jobs
scancel suppression d’un job
squeue liste des jobs dans les files d’attente
sprio prorités relatives des jobs en attente
scontrol affiche/modifie des données relatives aux tâches : jobs, nodes, partitions, reservations, etc.
seff affiche l’efficatité d’un job terminé
sacct affiche les données des jobs
sacctmgr affiche et modifie les informations des comptes Slurm
sattach attach to a running job step
sdiag display scheduling statistics and timing parameters
sreport generate canned reports from job accounting data and machine utilization statistics
sshare display the shares and usage for each charge account and user
sstat display process statistics of a running job/step
sview a graphical tool for displaying jobs, partitions, reservations, and Blue Gene block
sbcast transmit a file to the nodes allocated to a Slurm job.
scrontab manage Slurm crontab files
sh5util merge utility for acct_gather_profile plugin.
slurm Slurm system overview
strigger used to set, get or clear Slurm trigger information.

Commande scontrol

Affiche tous les nodes en détails :

$ scontrol show nodes

Lorsqu’un noeud n’est pas géré par SLURM il sera en Not responding :

[...]
NodeName=MyNode101 CoresPerSocket=30
CPUAlloc=0 CPUTot=50 CPULoad=N/A
[...]
Reason=Not responding

Géré par SLURM avec 1 erreur :

NodeName=MyNode42 Arch=x86_64 CoresPerSocket=30
CPUAlloc=10 CPUTot=50 CPULoad=8.01
[...]
Reason=Prolog error

Commande sinfo

Magik option : Indique quels noeuds est sous gestion SGE ou SLURM (sous réserve de l’avoir précisé)

# sinfo –Nel 

Documentation

https://pmcs2i.ec-lyon.fr/documentation/run/commands.html
https://hpc.llnl.gov/banks-jobs/running-jobs/slurm-commands
https://slurm.schedmd.com/man_index.html

> Partager <