doc:devel:cluster
Differences
This shows you the differences between two versions of the page.
| Both sides previous revisionPrevious revisionNext revision | Previous revision | ||
| doc:devel:cluster [2014/10/09 16:54] – [Lancer des calculs] papeleux | doc:devel:cluster [2018/05/04 17:13] (current) – removed boman | ||
|---|---|---|---|
| Line 1: | Line 1: | ||
| - | ====== Utilisation du cluster " | ||
| - | {{ : | ||
| - | |||
| - | Cette page a pour but de donner les infos minimales pour utiliser le cluster " | ||
| - | ===== Généralités ===== | ||
| - | |||
| - | La machine s' | ||
| - | |||
| - | Son IP est 139.165.41.12. On s'y connecte exclusivement par '' | ||
| - | ssh fabulous | ||
| - | |||
| - | De l' | ||
| - | |||
| - | Le cluster est l' | ||
| - | |||
| - | Coté disque, on est à l'aise (''/ | ||
| - | |||
| - | En RAM, chaque coeur dispose de 4Go. Autrement dit, chaque noeud possède 4x12=48Go de RAM, pour un total de 576Go si on somme les 12 noeuds. | ||
| - | |||
| - | Seul le " | ||
| - | |||
| - | L'OS installé est [[http:// | ||
| - | |||
| - | La plupart des applications et des libs sont installées sur ''/ | ||
| - | |||
| - | |||
| - | ===== Configuration de votre compte ===== | ||
| - | |||
| - | Passons aux choses sérieuses: vous avez fait "'' | ||
| - | |||
| - | __Avant toute chose__, modifiez votre mot de passe: | ||
| - | passwd | ||
| - | Choisissez quelque chose de pas trop simple à deviner. | ||
| - | |||
| - | __Une première étape:__ la config '' | ||
| - | |||
| - | __Étape suivante:__ configurer l' | ||
| - | |||
| - | |||
| - | __Fabulous et les modules:__ Le cluster a été conçu pour gérer des tas d' | ||
| - | boman@fabulous: | ||
| - | Currently Loaded Modulefiles: | ||
| - | 1) cmake/ | ||
| - | 2) samcef/ | ||
| - | 3) swig/ | ||
| - | 4) python/ | ||
| - | 5) qt/ | ||
| - | 6) vtk/ | ||
| - | 7) isosurf/ | ||
| - | 8) gmsh/2.5.0 | ||
| - | on voit les modules qui sont actuellement chargés sur mon compte. La liste de tous les modules disponibles s' | ||
| - | module avail | ||
| - | On peut modifier la liste des modules chargés par: | ||
| - | module add [nom du module] | ||
| - | module rm [nom du module] | ||
| - | Tout ça pour dire que si on veut travailler avec Metafor, il faut charger au démarrage les modules dont il dépend. Ceci est fait dans le fichier ~/ | ||
| - | <file module.profile> | ||
| - | # sge : gestionnaire de queue | ||
| - | module load sge | ||
| - | # applications nécessaires à la compilation - run metafor | ||
| - | module load cmake samcef swig python qt vtk | ||
| - | module load isosurf gmsh tetgen triangle matlab | ||
| - | module load gcc | ||
| - | |||
| - | # old intel-cluster-studio | ||
| - | #module load intel-tbb | ||
| - | #module load intel-cl-st/ | ||
| - | #module load intel-cl-st/ | ||
| - | |||
| - | # nouveau svn | ||
| - | module load subversion/ | ||
| - | |||
| - | # new intel-cluster-studio | ||
| - | . / | ||
| - | </ | ||
| - | |||
| - | Notez que sauf application particulière vous n'avez pas besoin de modifier les modules chargés. | ||
| - | | ||
| - | |||
| - | |||
| - | ===== Compiler Metafor ===== | ||
| - | |||
| - | Compiler Metafor se fait sur le " | ||
| - | "'' | ||
| - | |||
| - | Lancez " | ||
| - | < | ||
| - | Actions: | ||
| - | a/ e-mail address (reports) | ||
| - | c/ SVN repository | ||
| - | d/ SVN branch | ||
| - | e/ build options | ||
| - | f/ debug mode : False | ||
| - | j/ nb of task launched in parallel | ||
| - | k/ nb of threads by task : ' | ||
| - | m/ Run Method | ||
| - | n/ SGE queue : ' | ||
| - | o/ SGE run on local disk : True | ||
| - | p/ additional SGE args : '' | ||
| - | |||
| - | 1/ source | ||
| - | 2/ compile | ||
| - | 3/ battery | ||
| - | 4/ installer | ||
| - | |||
| - | G/ GO | ||
| - | S/ SAVE | ||
| - | Q/ QUIT | ||
| - | |||
| - | Your choice? | ||
| - | </ | ||
| - | La configuration fabulous.cmake contient toutes les informations pour compiler par défaut avec le compilateur intel (le gcc étant trop vieux pour compiler Metafor). | ||
| - | Lancez la compilation par "'' | ||
| - | |||
| - | |||
| - | |||
| - | |||
| - | ===== Lancer des calculs ===== | ||
| - | |||
| - | Pour lancer un calcul sur les noeuds, il ne faut pas vous connecter sur les noeuds. L' | ||
| - | |||
| - | Encore une fois, il est possible de faire ça manuellement ou grâce aux scripts de Metafor (dans ce cas-ci, c'est "'' | ||
| - | |||
| - | Ensuite créez un répertoire vide et allez dedans. Tapez "'' | ||
| - | < | ||
| - | a/ e-mail address (reports) | ||
| - | b/ exec name : ' | ||
| - | c/ test name : ' | ||
| - | d/ logfile (no ext) : ' | ||
| - | e/ algorithm | ||
| - | j/ nb of task launched in parallel | ||
| - | k/ nb of threads by task : ' | ||
| - | m/ Run Method | ||
| - | n/ SGE queue : ' | ||
| - | o/ SGE run on local disk : True | ||
| - | p/ additional SGE args : '' | ||
| - | u/ ftp transfert | ||
| - | |||
| - | G/ GO | ||
| - | S/ SAVE | ||
| - | Q/ QUIT | ||
| - | |||
| - | Your choice? | ||
| - | </ | ||
| - | Choisissez la méthode de run " | ||
| - | Metafor est capable d' | ||
| - | |||
| - | <note warning> | ||
| - | ATTENTION : A ce jour, la configuration des queues via SGE ou le script de lancement des calculs généré par launch.py permet de lancer plusieures tâches en même temps, MAIS seul 1 job tournera effectivement.\\ | ||
| - | Conclusion : ne demandez pas plus d'1 tâche à la fois par '' | ||
| - | < | ||
| - | j/ nb of task launched in parallel | ||
| - | </ | ||
| - | (=> splittez vos tests dans plusieurs répértoires et faites plusieurs commandes launch ...) | ||
| - | </ | ||
| - | |||
| - | Une fois que le job est lancé, il est possible de voir le statut de la queue et du job en faisant: | ||
| - | qstat -f | ||
| - | Voilà ce que ça peut donner: | ||
| - | < | ||
| - | boman@fabulous: | ||
| - | queuename | ||
| - | --------------------------------------------------------------------------------- | ||
| - | all.q@node001.cm.cluster | ||
| - | 72 0.58500 fullblade7 boman r | ||
| - | --------------------------------------------------------------------------------- | ||
| - | all.q@node002.cm.cluster | ||
| - | --------------------------------------------------------------------------------- | ||
| - | all.q@node003.cm.cluster | ||
| - | 69 0.50500 barbara04f boman r | ||
| - | --------------------------------------------------------------------------------- | ||
| - | all.q@node004.cm.cluster | ||
| - | 73 0.56500 fullblade7 boman r | ||
| - | --------------------------------------------------------------------------------- | ||
| - | all.q@node005.cm.cluster | ||
| - | 74 0.54500 fullblade7 boman r | ||
| - | --------------------------------------------------------------------------------- | ||
| - | all.q@node006.cm.cluster | ||
| - | --------------------------------------------------------------------------------- | ||
| - | all.q@node007.cm.cluster | ||
| - | 76 0.50500 fullblade7 boman r | ||
| - | --------------------------------------------------------------------------------- | ||
| - | all.q@node008.cm.cluster | ||
| - | --------------------------------------------------------------------------------- | ||
| - | all.q@node009.cm.cluster | ||
| - | --------------------------------------------------------------------------------- | ||
| - | all.q@node010.cm.cluster | ||
| - | 75 0.52500 fullblade7 boman r | ||
| - | --------------------------------------------------------------------------------- | ||
| - | all.q@node011.cm.cluster | ||
| - | 71 0.60500 fullblade7 boman r | ||
| - | --------------------------------------------------------------------------------- | ||
| - | all.q@node012.cm.cluster | ||
| - | |||
| - | ############################################################################ | ||
| - | - PENDING JOBS - PENDING JOBS - PENDING JOBS - PENDING JOBS - PENDING JOBS | ||
| - | ############################################################################ | ||
| - | 79 0.00000 dev.batter boman qw 05/17/2011 16: | ||
| - | </ | ||
| - | |||
| - | Pour voir tous les jobs gérés par SGE pour tous les utilisateurs: | ||
| - | qstat -u ' | ||
| - | Pour supprimer son job avant la fin, il suffit de repérer son numéro par "'' | ||
| - | qdel [numero] | ||
| - | Des mails sont envoyés par SGE pour signaler le démarrage, le kill ou la fin du job. | ||
| - | |||
| - | Au lancement de jobs à travers "'' | ||
| - | |||
| - | qDelxxxx.py : permet de killer un job (Attention, cette commande ne gère pas la copie et suppression des fichiers temporaires de calcul sur le disque du noeud de calcul) | ||
| - | cpNodeResultsxxxx.py : copie les fichiers du disque du noeud de calcul (''/ | ||
| - | rmNodeResultsxxxx.py : nettoye le disque du noeud de calcul des fichiers du process xxxx ('' | ||
| - | |||
| - | Vous êtes donc priés de nettoyer les disques locaux si vous supprimez des jobs en cours de calcul. | ||
| - | |||
| - | Nb : le script '' | ||
| - | |||
| - | Pour plus d' | ||
| - | |||
| - | ===== En savoir plus ===== | ||
| - | |||
| - | La doc utilisateur du cluster est dispo dans ''/ | ||
| - | |||
| - | \\ | ||
| - | \\ | ||
| - | \\ | ||
| - | --- // | ||
| - | \\ | ||
| - | \\ | ||
doc/devel/cluster.1412866461.txt.gz · Last modified: (external edit)
