L’interface utilisateur de ligne de commande de Sun Grid Engine consiste en un jeu de programmes (commandes) auxiliaires qui vous permet de gérer des files d’attente, de soumettre et de supprimer des travaux, de vérifier l’état d’un travail et d’interrompre ou d’activer des files d’attente et des travaux. Le système Sun Grid Engine se sert du jeu de programmes auxilliaires suivant : Commandes Commande Définition qacct extrait des informations de comptabilité arbitraire du fichier journ
SLURM (Simple Linux Utility for Resource Management) est un planificateur de tâches gratuit et open source pour les noyaux de type Linux et Unix, utilisé par de nombreux superordinateurs et grappes d’ordinateurs dans le monde. Commandes de baseFile d’attente = queue = partition dans SLURM Commande Définition sinfo interrogation des files d’attente sbatch soumission d’un job dans une file d’attente (appelées partitions dans SLURM) salloc réservation de ressources en intera
Problème rencontrés avec des noeuds sous gestions SLURM. Etats possibles des noeuds2022/10/01/SLURM-Status-des-noeuds/ Commandes de baseVérifier l’état des noeudsAffiche uniquement la raison des noeuds en down, drained and draining : # sinfo -R Pour des informations plus détaillées (non troquées) : # sinfo -Nel Affiche le détail d’un noeud en particulier : # scontrol show nodes=<mynode> Equivalent à (sans le “s” à node) : # scontrol show node <mynode> Affiche tous les noeuds en
Dans un premier temps : s’assurer que les noeuds en questions sont bien gérés par SGE Etats des queuesStatuts d’erreur possibleSous SGE, les statuts possibles pour une queue sont : a : alarm c : configuration ambiguous d : disable o : ? (operator) s : Suspending u : unreachable A : Alarm - Quand le noeud est full ou a utilisé toutes ses ressources AU : Alarm - Unreachable AS : Alarm - Suspended - Si le noeud a atteint ses limites, SGE lui interdit de prendre un autre job et attent
La commande wc (World Count) accepte un ou plusieurs noms de fichiers mais peut aussi lire la sortie de la console. Sans options, la commande WC imprimera quatre colonnes : nombre de lignes nombre de mots nombre d’octets nom du fichier (si recherche dans fichier) UtilisationsExtrait du manuelL’aide console : -l, –lines Imprimez (que) le nombre de lignes-w, –words Imprimez (que) le nombre de mots-m, –chars Imprimez (que) le nombre de caractères-c, –bytes Imprimez (que) le nombre d'octets-L
Pour ajouter/changer un groupe à un utilisateur on utilise usermod - mais - il faut faire attention aux options sinon tous les anciens groupes de l’utilisateur seront supprimés. UtilisationExtrait du manuelExtrait du manuel : -d, --home HOME_DIR new home directory for the user account-e, --expiredate EXPIRE_DATE set account expiration date to EXPIRE_DATE-f, --inactive INACTIVE set password inactive after expiration to INACTIVE-g, --gid GROUP force use GROUP as new
Lorsqu’il est nécessaire de modifier les permissions de fichiers et de répertoires récursivement dans une arborescence, le commande find, associée à exec ou xargs, permet d’appliquer des droits précis en fonction du résultat trouvé. ManuelDéfinition dans les manuels : xargs — build and execute command lines from standard input exec — execute commands and open, close, or copy file descriptors Changer des droits dans le résultat d’une commandePour changer des droits en fonction d’un répertoire o
L’astérisque * permet de sélectionner tous les fichiers d’un répertoire, mais un message d’erreur peut survenir : ls: cannot access *: No such file or directory. Ce message survient si les permissions ou le type de volume empêchent l’accès direct. L’utilisation de sudo bash -c permet d’exécuter la commande dans un contexte ayant les droits nécessaires. Alternative à *Exemples d’erreurs: $ sudo ls /<path>/*ls: cannot access *: No such file or directory # grep "word" /<path>
La commande chage (change age) permet de modifier les informations de validité d’un mot de passe d’un utilisateur : nombre de jours entre les changements de mot de passe et la date du dernier changement. Elle est également très pratique pour forcer un utilisateur à changer son mot de passe lorsqu’un mot de passe temporaire lui a été attribué lors d’un oubli. Commande chageL’aide (extrait) : -d, --lastday LAST_DAY Configurer le nombre du jour où le mot de passe a été changé la dernière foi
Les quotas sour SGE permettent d’appliquer des limites à plusieurs types de ressources en fonctions des consommateurs. Types de ressources et types de consommateursRessourcesLes ressources peuvent être des : slots (coeurs) arch (architectures) mem_total (mémoire) num_proc (nombre de processeur) swap_total (mémoire swap) built-in resources (ressources interne) custom-defined resource (ressources ajoutées, comme un compilateur de licence) ConsommateursLes consommateurs de ressources peuvent être
Certains users ont besoin de plus de ressources pour réaliser des calculs et il est possible de leur allouer personnellement plus de coeurs sous SGE. Lister les quotasCommandesPour lister tous les quotas définis, on utilise la commande qconf avec les options s, r, q, s, et l : # qconf -srqsl Pour voir tous les quotas détaillés : # qconf -srqs Pour voir un quotas en particulier il suffit de préciser son nom : # qconf -srqs [nom] ExemplesLister tous les quotas définis : # qconf -srqslmax_slots
Créer des utilisateurs SLURM. Lister l’ensemble des utilisateurs et comptes SLURMLes comptes SLURM se différentient des utilisateurs SLURM. UtilisateursSur votre cluster : # sacctmgr list user Exemple de sortie : User Def Acct Admin------ ----------- ---------dustin ST Nonejim ST Noneeleven ST NoneErica ST Nonedartagn+ DG Noneroot Administ+mike ST Nonewill ST Nonebilly ST