doc:devel:cluster
Differences
This shows you the differences between two versions of the page.
Both sides previous revisionPrevious revisionNext revision | Previous revision | ||
doc:devel:cluster [2014/10/06 18:22] – [Lancer des calculs] papeleux | doc:devel:cluster [2018/05/04 17:13] (current) – removed boman | ||
---|---|---|---|
Line 1: | Line 1: | ||
- | ====== Utilisation du cluster " | ||
- | {{ : | ||
- | |||
- | Cette page a pour but de donner les infos minimales pour utiliser le cluster " | ||
- | ===== Généralités ===== | ||
- | |||
- | La machine s' | ||
- | |||
- | Son IP est 139.165.41.12. On s'y connecte exclusivement par '' | ||
- | ssh fabulous | ||
- | |||
- | De l' | ||
- | |||
- | Le cluster est l' | ||
- | |||
- | Coté disque, on est à l'aise (''/ | ||
- | |||
- | En RAM, chaque coeur dispose de 4Go. Autrement dit, chaque noeud possède 4x12=48Go de RAM, pour un total de 576Go si on somme les 12 noeuds. | ||
- | |||
- | Seul le " | ||
- | |||
- | L'OS installé est [[http:// | ||
- | |||
- | La plupart des applications et des libs sont installées sur ''/ | ||
- | |||
- | |||
- | ===== Configuration de votre compte ===== | ||
- | |||
- | Passons aux choses sérieuses: vous avez fait "'' | ||
- | |||
- | __Avant toute chose__, modifiez votre mot de passe: | ||
- | passwd | ||
- | Choisissez quelque chose de pas trop simple à deviner. | ||
- | |||
- | __Une première étape:__ la config '' | ||
- | |||
- | __Étape suivante:__ configurer l' | ||
- | |||
- | |||
- | __Fabulous et les modules:__ Le cluster a été conçu pour gérer des tas d' | ||
- | boman@fabulous: | ||
- | Currently Loaded Modulefiles: | ||
- | 1) cmake/ | ||
- | 2) samcef/ | ||
- | 3) swig/ | ||
- | 4) python/ | ||
- | 5) qt/ | ||
- | 6) vtk/ | ||
- | 7) isosurf/ | ||
- | 8) gmsh/2.5.0 | ||
- | on voit les modules qui sont actuellement chargés sur mon compte. La liste de tous les modules disponibles s' | ||
- | module avail | ||
- | On peut modifier la liste des modules chargés par: | ||
- | module add [nom du module] | ||
- | module rm [nom du module] | ||
- | Tout ça pour dire que si on veut travailler avec Metafor, il faut charger au démarrage les modules dont il dépend. Ceci est fait dans le fichier ~/ | ||
- | <file module.profile> | ||
- | # sge : gestionnaire de queue | ||
- | module load sge | ||
- | # applications nécessaires à la compilation - run metafor | ||
- | module load cmake samcef swig python qt vtk | ||
- | module load isosurf gmsh tetgen triangle matlab | ||
- | module load gcc | ||
- | |||
- | # old intel-cluster-studio | ||
- | #module load intel-tbb | ||
- | #module load intel-cl-st/ | ||
- | #module load intel-cl-st/ | ||
- | |||
- | # nouveau svn | ||
- | module load subversion/ | ||
- | |||
- | # new intel-cluster-studio | ||
- | . / | ||
- | </ | ||
- | |||
- | Notez que sauf application particulière vous n'avez pas besoin de modifier les modules chargés. | ||
- | | ||
- | |||
- | |||
- | ===== Compiler Metafor ===== | ||
- | |||
- | Compiler Metafor se fait sur le " | ||
- | "'' | ||
- | |||
- | Lancez " | ||
- | < | ||
- | Actions: | ||
- | a/ e-mail address (reports) | ||
- | c/ SVN repository | ||
- | d/ SVN branch | ||
- | e/ build options | ||
- | f/ debug mode : False | ||
- | j/ nb of task launched in parallel | ||
- | k/ nb of threads by task : ' | ||
- | m/ Run Method | ||
- | n/ SGE queue : ' | ||
- | o/ SGE run on local disk : True | ||
- | p/ additional SGE args : '' | ||
- | |||
- | 1/ source | ||
- | 2/ compile | ||
- | 3/ battery | ||
- | 4/ installer | ||
- | |||
- | G/ GO | ||
- | S/ SAVE | ||
- | Q/ QUIT | ||
- | |||
- | Your choice? | ||
- | </ | ||
- | La configuration fabulous.cmake contient toutes les informations pour compiler par défaut avec le compilateur intel (le gcc étant trop vieux pour compiler Metafor). | ||
- | Lancez la compilation par "'' | ||
- | |||
- | |||
- | |||
- | |||
- | ===== Lancer des calculs ===== | ||
- | |||
- | Pour lancer un calcul sur les noeuds, il ne faut pas vous connecter sur les noeuds. L' | ||
- | |||
- | Encore une fois, il est possible de faire ça manuellement ou grâce aux scripts de Metafor (dans ce cas-ci, c'est "'' | ||
- | |||
- | Ensuite créez un répertoire vide et allez dedans. Tapez "'' | ||
- | < | ||
- | a/ e-mail address (reports) | ||
- | b/ exec name : ' | ||
- | c/ test name : ' | ||
- | d/ logfile (no ext) : ' | ||
- | e/ algorithm | ||
- | j/ nb of task launched in parallel | ||
- | k/ nb of threads by task : ' | ||
- | m/ Run Method | ||
- | n/ SGE queue : ' | ||
- | o/ SGE run on local disk : True | ||
- | p/ additional SGE args : '' | ||
- | u/ ftp transfert | ||
- | |||
- | G/ GO | ||
- | S/ SAVE | ||
- | Q/ QUIT | ||
- | |||
- | Your choice? | ||
- | </ | ||
- | Choisissez la méthode de run " | ||
- | Metafor est capable d' | ||
- | |||
- | Une fois que le job est lancé, il est possible de voir le statut de la queue et du job en faisant: | ||
- | qstat -f | ||
- | Voilà ce que ça peut donner: | ||
- | < | ||
- | boman@fabulous: | ||
- | queuename | ||
- | --------------------------------------------------------------------------------- | ||
- | all.q@node001.cm.cluster | ||
- | 72 0.58500 fullblade7 boman r | ||
- | --------------------------------------------------------------------------------- | ||
- | all.q@node002.cm.cluster | ||
- | --------------------------------------------------------------------------------- | ||
- | all.q@node003.cm.cluster | ||
- | 69 0.50500 barbara04f boman r | ||
- | --------------------------------------------------------------------------------- | ||
- | all.q@node004.cm.cluster | ||
- | 73 0.56500 fullblade7 boman r | ||
- | --------------------------------------------------------------------------------- | ||
- | all.q@node005.cm.cluster | ||
- | 74 0.54500 fullblade7 boman r | ||
- | --------------------------------------------------------------------------------- | ||
- | all.q@node006.cm.cluster | ||
- | --------------------------------------------------------------------------------- | ||
- | all.q@node007.cm.cluster | ||
- | 76 0.50500 fullblade7 boman r | ||
- | --------------------------------------------------------------------------------- | ||
- | all.q@node008.cm.cluster | ||
- | --------------------------------------------------------------------------------- | ||
- | all.q@node009.cm.cluster | ||
- | --------------------------------------------------------------------------------- | ||
- | all.q@node010.cm.cluster | ||
- | 75 0.52500 fullblade7 boman r | ||
- | --------------------------------------------------------------------------------- | ||
- | all.q@node011.cm.cluster | ||
- | 71 0.60500 fullblade7 boman r | ||
- | --------------------------------------------------------------------------------- | ||
- | all.q@node012.cm.cluster | ||
- | |||
- | ############################################################################ | ||
- | - PENDING JOBS - PENDING JOBS - PENDING JOBS - PENDING JOBS - PENDING JOBS | ||
- | ############################################################################ | ||
- | 79 0.00000 dev.batter boman qw 05/17/2011 16: | ||
- | </ | ||
- | |||
- | Pour voir tous les jobs gérés par SGE pour tous les utilisateurs: | ||
- | qstat -u ' | ||
- | Pour supprimer son job avant la fin, il suffit de repérer son numéro par "'' | ||
- | qdel [numero] | ||
- | Des mails sont envoyés par SGE pour signaler le démarrage, le kill ou la fin du job. | ||
- | |||
- | Au lancement de jobs à travers "'' | ||
- | |||
- | qDelxxxx.py : permet de killer un job (Attention, cette commande ne gère pas la copie et suppression des fichiers temporaires de calcul sur le disque du noeud de calcul) | ||
- | cpNodeResultsxxxx.py : copie les fichiers du disque du noeud de calcul (''/ | ||
- | rmNodeResultsxxxx.py : nettoye le disque du noeud de calcul des fichiers du process xxxx ('' | ||
- | |||
- | Vous êtes donc priés de nettoyer les disques locaux si vous supprimez des jobs en cours de calcul. | ||
- | |||
- | Nb : le script '' | ||
- | |||
- | Pour plus d' | ||
- | |||
- | ===== En savoir plus ===== | ||
- | |||
- | La doc utilisateur du cluster est dispo dans ''/ | ||
- | |||
- | \\ | ||
- | \\ | ||
- | \\ | ||
- | --- // | ||
- | \\ | ||
- | \\ |
doc/devel/cluster.1412612578.txt.gz · Last modified: 2016/03/30 15:22 (external edit)