doc:devel:cluster
Differences
This shows you the differences between two versions of the page.
| Both sides previous revisionPrevious revisionNext revision | Previous revision | ||
| doc:devel:cluster [2014/10/06 17:57] – papeleux | doc:devel:cluster [2018/05/04 17:13] (current) – removed boman | ||
|---|---|---|---|
| Line 1: | Line 1: | ||
| - | ====== Utilisation du cluster " | ||
| - | {{ : | ||
| - | |||
| - | Cette page a pour but de donner les infos minimales pour utiliser le cluster " | ||
| - | ===== Généralités ===== | ||
| - | |||
| - | La machine s' | ||
| - | |||
| - | Son IP est 139.165.41.12. On s'y connecte exclusivement par '' | ||
| - | ssh fabulous | ||
| - | |||
| - | De l' | ||
| - | |||
| - | Le cluster est l' | ||
| - | |||
| - | Coté disque, on est à l'aise (''/ | ||
| - | |||
| - | En RAM, chaque coeur dispose de 4Go. Autrement dit, chaque noeud possède 4x12=48Go de RAM, pour un total de 576Go si on somme les 12 noeuds. | ||
| - | |||
| - | Seul le " | ||
| - | |||
| - | L'OS installé est [[http:// | ||
| - | |||
| - | La plupart des applications et des libs sont installées sur ''/ | ||
| - | |||
| - | |||
| - | ===== Configuration de votre compte ===== | ||
| - | |||
| - | Passons aux choses sérieuses: vous avez fait "'' | ||
| - | |||
| - | __Avant toute chose__, modifiez votre mot de passe: | ||
| - | passwd | ||
| - | Choisissez quelque chose de pas trop simple à deviner. | ||
| - | |||
| - | __Une première étape:__ la config '' | ||
| - | |||
| - | __Étape suivante:__ configurer l' | ||
| - | |||
| - | |||
| - | __Fabulous et les modules:__ Le cluster a été conçu pour gérer des tas d' | ||
| - | boman@fabulous: | ||
| - | Currently Loaded Modulefiles: | ||
| - | 1) cmake/ | ||
| - | 2) samcef/ | ||
| - | 3) swig/ | ||
| - | 4) python/ | ||
| - | 5) qt/ | ||
| - | 6) vtk/ | ||
| - | 7) isosurf/ | ||
| - | 8) gmsh/2.5.0 | ||
| - | on voit les modules qui sont actuellement chargés sur mon compte. La liste de tous les modules disponibles s' | ||
| - | module avail | ||
| - | On peut modifier la liste des modules chargés par: | ||
| - | module add [nom du module] | ||
| - | module rm [nom du module] | ||
| - | Tout ça pour dire que si on veut travailler avec Metafor, il faut charger au démarrage les modules dont il dépend. Ceci est fait dans le fichier ~/ | ||
| - | <file module.profile> | ||
| - | # sge : gestionnaire de queue | ||
| - | module load sge | ||
| - | # applications nécessaires à la compilation - run metafor | ||
| - | module load cmake samcef swig python qt vtk | ||
| - | module load isosurf gmsh tetgen triangle matlab | ||
| - | module load gcc | ||
| - | |||
| - | # old intel-cluster-studio | ||
| - | #module load intel-tbb | ||
| - | #module load intel-cl-st/ | ||
| - | #module load intel-cl-st/ | ||
| - | |||
| - | # nouveau svn | ||
| - | module load subversion/ | ||
| - | |||
| - | # new intel-cluster-studio | ||
| - | . / | ||
| - | </ | ||
| - | |||
| - | Notez que sauf application particulière vous n'avez pas besoin de modifier les modules chargés. | ||
| - | | ||
| - | |||
| - | |||
| - | ===== Compiler Metafor ===== | ||
| - | |||
| - | Compiler Metafor se fait sur le " | ||
| - | "'' | ||
| - | |||
| - | Lancez " | ||
| - | < | ||
| - | Actions: | ||
| - | a/ e-mail address (reports) | ||
| - | c/ SVN repository | ||
| - | d/ SVN branch | ||
| - | e/ build options | ||
| - | f/ debug mode : False | ||
| - | j/ nb of task launched in parallel | ||
| - | k/ nb of threads by task : ' | ||
| - | m/ Run Method | ||
| - | n/ SGE queue : ' | ||
| - | o/ SGE run on local disk : True | ||
| - | p/ additional SGE args : '' | ||
| - | |||
| - | 1/ source | ||
| - | 2/ compile | ||
| - | 3/ battery | ||
| - | 4/ installer | ||
| - | |||
| - | G/ GO | ||
| - | S/ SAVE | ||
| - | Q/ QUIT | ||
| - | |||
| - | Your choice? | ||
| - | </ | ||
| - | La configuration fabulous.cmake contient toutes les informations pour compiler par défaut avec le compilateur intel (le gcc étant trop vieux pour compiler Metafor). | ||
| - | Lancez la compilation par "'' | ||
| - | |||
| - | |||
| - | __Subtilité avec le compilateur Intel: | ||
| - | |||
| - | Pour compiler avec le compilateur Intel, il faut désactiver le module " | ||
| - | module rm gcc | ||
| - | Je n'ai pas encore très bien compris pourquoi. Si on laisse les deux compilateurs actifs, les fonctions " | ||
| - | |||
| - | Par contre, une fois l' | ||
| - | |||
| - | |||
| - | |||
| - | |||
| - | ===== Lancer des calculs ===== | ||
| - | |||
| - | Pour lancer un calcul sur les noeuds, il ne faut pas vous connecter sur les noeuds. L' | ||
| - | |||
| - | Encore une fois, il est possible de faire ça manuellement ou grâce aux scripts de Metafor (dans ce cas-ci, c'est "'' | ||
| - | < | ||
| - | Actions: | ||
| - | a/ e-mail address (reports) | ||
| - | b/ exec name : '/ | ||
| - | c/ test name : ' | ||
| - | d/ logfile (no ext) : ' | ||
| - | e/ nice value : ' | ||
| - | f/ algorithm | ||
| - | h/ post script | ||
| - | i/ ftp transfert | ||
| - | o/ nb of cores : ' | ||
| - | p/ affinity (cores list) : '' | ||
| - | |||
| - | G/ GO | ||
| - | B/ BATCH | ||
| - | U/ QUEUE TO SGE | ||
| - | S/ SAVE | ||
| - | Q/ QUIT | ||
| - | |||
| - | Your choice? | ||
| - | </ | ||
| - | J'ai ajouté une option "QUEUE TO SGE (U)" pour transmettre le job au système SGE qui dispatche les jobs sur les noeuds. Une fois que le job est lancé, il est possible de voir le statut de la queue et du job en faisant: | ||
| - | qstat -f | ||
| - | Voilà ce que ça peut donner: | ||
| - | < | ||
| - | boman@fabulous: | ||
| - | queuename | ||
| - | --------------------------------------------------------------------------------- | ||
| - | all.q@node001.cm.cluster | ||
| - | 72 0.58500 fullblade7 boman r | ||
| - | --------------------------------------------------------------------------------- | ||
| - | all.q@node002.cm.cluster | ||
| - | --------------------------------------------------------------------------------- | ||
| - | all.q@node003.cm.cluster | ||
| - | 69 0.50500 barbara04f boman r | ||
| - | --------------------------------------------------------------------------------- | ||
| - | all.q@node004.cm.cluster | ||
| - | 73 0.56500 fullblade7 boman r | ||
| - | --------------------------------------------------------------------------------- | ||
| - | all.q@node005.cm.cluster | ||
| - | 74 0.54500 fullblade7 boman r | ||
| - | --------------------------------------------------------------------------------- | ||
| - | all.q@node006.cm.cluster | ||
| - | --------------------------------------------------------------------------------- | ||
| - | all.q@node007.cm.cluster | ||
| - | 76 0.50500 fullblade7 boman r | ||
| - | --------------------------------------------------------------------------------- | ||
| - | all.q@node008.cm.cluster | ||
| - | --------------------------------------------------------------------------------- | ||
| - | all.q@node009.cm.cluster | ||
| - | --------------------------------------------------------------------------------- | ||
| - | all.q@node010.cm.cluster | ||
| - | 75 0.52500 fullblade7 boman r | ||
| - | --------------------------------------------------------------------------------- | ||
| - | all.q@node011.cm.cluster | ||
| - | 71 0.60500 fullblade7 boman r | ||
| - | --------------------------------------------------------------------------------- | ||
| - | all.q@node012.cm.cluster | ||
| - | |||
| - | ############################################################################ | ||
| - | - PENDING JOBS - PENDING JOBS - PENDING JOBS - PENDING JOBS - PENDING JOBS | ||
| - | ############################################################################ | ||
| - | 79 0.00000 dev.batter boman qw 05/17/2011 16: | ||
| - | </ | ||
| - | |||
| - | Pour voir tous les jobs gérés par SGE pour tous les utilisateurs: | ||
| - | qstat -u ' | ||
| - | Pour supprimer son job avant la fin, il suffit de repérer son numéro par "'' | ||
| - | qdel [numero] | ||
| - | Des mails sont envoyés par SGE pour signaler le démarrage, le kill ou la fin du job. | ||
| - | |||
| - | Pour plus d' | ||
| - | |||
| - | ===== En savoir plus ===== | ||
| - | |||
| - | La doc utilisateur du cluster est dispo dans ''/ | ||
| - | |||
| - | \\ | ||
| - | \\ | ||
| - | \\ | ||
| - | --- // | ||
| - | \\ | ||
| - | \\ | ||
doc/devel/cluster.1412611042.txt.gz · Last modified: (external edit)
