devel:cluster
Differences
This shows you the differences between two versions of the page.
Both sides previous revisionPrevious revisionNext revision | Previous revisionLast revisionBoth sides next revision | ||
devel:cluster [2017/06/28 12:29] – papeleux | devel:cluster [2017/06/28 15:58] – papeleux | ||
---|---|---|---|
Line 124: | Line 124: | ||
===== Lancer des calculs ===== | ===== Lancer des calculs ===== | ||
- | Pour lancer un calcul sur les noeuds, il ne faut pas vous connecter sur les noeuds. | + | Pour lancer un calcul sur les noeuds, il ne faut pas vous connecter sur les noeuds. |
- | Encore une fois, il est possible de faire ça manuellement ou grâce aux scripts de Metafor (dans ce cas-ci, c'est "'' | + | L'utilitaire |
- | Ensuite créez | + | <note warning> ATTENTION : Actuellement, |
- | < | + | </ |
- | a/ e-mail address (reports) | + | |
- | b/ exec name : '../oo_metaB/ | + | Une fois organisé |
- | c/ test name : 'apps.qs.cont2' | + | < |
+ | Actions: | ||
+ | b/ exec name : '../Metafor/ | ||
+ | c/ test filename | ||
d/ logfile (no ext) : ' | d/ logfile (no ext) : ' | ||
e/ algorithm | e/ algorithm | ||
+ | g/ Run multiple test on dir : False | ||
j/ nb of task launched in parallel | j/ nb of task launched in parallel | ||
- | k/ nb of threads by task : '1' | + | k/ nb of threads by task : '12' |
- | m/ Run Method | + | m/ Run Method |
- | | + | |
- | | + | |
- | | + | |
+ | q/ Time (d-hh: | ||
u/ ftp transfert | u/ ftp transfert | ||
Line 147: | Line 152: | ||
Q/ QUIT | Q/ QUIT | ||
- | Your choice? | + | |
</ | </ | ||
- | Choisissez la méthode de run " | ||
- | Metafor est capable d' | ||
- | <note warning> | + | Configurez les chemins vers l' |
- | ATTENTION : A ce jour, la configuration des queues via SGE ou le script | + | (ATTENTION le produit (nbTests * nbThreads) ne peut dépasser le nombre de coeurs sur 1 noeud soit 12). |
- | Conclusion | + | |
+ | Choisissez la méthode de run " | ||
+ | Metafor est capable d' | ||
+ | |||
+ | Soyez attentif aux paramètres de mémoire ( "'' | ||
+ | et de temps de calcul demandés ("'' | ||
+ | |||
+ | Une fois que le job est lancé, ("'' | ||
< | < | ||
- | j/ nb of task launched in parallel | + | Your choice? go in slurm |
+ | sending job ' | ||
+ | Submitted batch job 450 | ||
+ | Submission SUCCESSFUL! | ||
+ | use ' squeue -l -j 450 ' to check the status | ||
+ | use ' | ||
+ | use ' sstat -a --format=JobID, | ||
+ | use ' scancel 450 ' to kill your job | ||
+ | use ' sacct --format=JobID, | ||
+ | [papeleux@fabulous Tests]$ | ||
</ | </ | ||
- | (=> splittez vos tests dans plusieurs répértoires et faites plusieurs commandes launch ...) | ||
- | </ | ||
- | Une fois que le job est lancé, il est possible de voir le statut de la queue et du job en faisant: | + | |
- | qstat -f | + | |
- | Voilà ce que ça peut donner: | + | |
< | < | ||
- | boman@fabulous: | + | |
- | queuename | + | </code> |
- | --------------------------------------------------------------------------------- | + | |
- | all.q@node001.cm.cluster | + | |
- | 72 0.58500 fullblade7 boman r 05/17/2011 12: | + | |
- | --------------------------------------------------------------------------------- | + | |
- | all.q@node002.cm.cluster | + | |
- | --------------------------------------------------------------------------------- | + | |
- | all.q@node003.cm.cluster | + | |
- | 69 0.50500 barbara04f boman r | + | |
- | --------------------------------------------------------------------------------- | + | |
- | all.q@node004.cm.cluster | + | |
- | 73 0.56500 fullblade7 boman r | + | |
- | --------------------------------------------------------------------------------- | + | |
- | all.q@node005.cm.cluster | + | |
- | 74 0.54500 fullblade7 boman r | + | |
- | --------------------------------------------------------------------------------- | + | |
- | all.q@node006.cm.cluster | + | |
- | --------------------------------------------------------------------------------- | + | |
- | all.q@node007.cm.cluster | + | |
- | 76 0.50500 fullblade7 boman r | + | |
- | --------------------------------------------------------------------------------- | + | |
- | all.q@node008.cm.cluster | + | |
- | --------------------------------------------------------------------------------- | + | |
- | all.q@node009.cm.cluster | + | |
- | --------------------------------------------------------------------------------- | + | |
- | all.q@node010.cm.cluster | + | |
- | 75 0.52500 fullblade7 boman r | + | |
- | --------------------------------------------------------------------------------- | + | |
- | all.q@node011.cm.cluster | + | |
- | 71 0.60500 fullblade7 boman r | + | |
- | --------------------------------------------------------------------------------- | + | |
- | all.q@node012.cm.cluster | + | |
- | ############################################################################ | + | Voilà ce que ça peut donner: |
- | | + | < |
- | ############################################################################ | + | Wed Jun 28 15:24:19 2017 |
- | 79 0.00000 dev.batter boman qw 05/ | + | JOBID PARTITION |
+ | 418 defq metafor wautelet | ||
</ | </ | ||
- | Pour voir tous les jobs gérés par SGE pour tous les utilisateurs: | + | pour plus d'info sur les commandes Slurm : [[devel: |
- | qstat -u ' | + | |
- | Pour voir les nom complet de vos jobs gérés par SGE: | + | |
- | qstat -r | grep "Full jobname" | + | |
- | Pour supprimer son job avant la fin, il suffit de repérer son numéro par "'' | + | |
- | qdel [numero] | + | |
Des mails sont envoyés par SGE pour signaler le démarrage, le kill ou la fin du job. | Des mails sont envoyés par SGE pour signaler le démarrage, le kill ou la fin du job. | ||
Line 222: | Line 207: | ||
Nb : le script '' | Nb : le script '' | ||
+ | |||
+ | Nb2 : Les noeuds de calcul n' | ||
Pour plus d' | Pour plus d' |
devel/cluster.txt · Last modified: 2017/06/28 16:14 by papeleux