Metafor

ULiege - Aerospace & Mechanical Engineering

User Tools

Site Tools


commit:2014:01_16

Commit 2014-01-16

Portage du code sur HMEM

Le CECI (Consortium des Équipements de Calcul Intensif) est un consortium financé par le FNRS qui regroupe différents clusters des universités francophones et leurs utilisateurs. Je viens de découvrir que n'importe quelle personne disposant d'un e-mail ulg (personnel ou étudiant) peut demander un compte et accéder aux machines pour faire des calculs (c'est gratuit tant qu'on ne depasse pas 200k heures.coeurs/an).

Ca me semble très intéressant puisqu'on peut ainsi demander aux étudiants de faire des calculs lourds sans donner accès à notre cluster privé (c'est ce qu'on prévoit de faire pour le projet de calcul multiphysique avec Christophe Geuzaine).

On peut aussi faire des calculs pour nous mêmes et profiter de machines très différentes des notres. La plupart des clusters ont une interconnexion réseau infiniband par exemple. Regardez ici la liste des machines.

Pour tester le systeme, j'ai compilé Metafor sur HMEM, un cluster de l'UCL qui a particularité d'avoir des noeuds à 48 coeurs et 512Go de RAM. C'est l'idéal pour des gros jobs SMP comme on fait avec Metafor. Cette compilation a demandé de créer un fichier hmem-icc.cmake. J'en ai profité pour corriger un problème qui empêchait de compiler le code sans Qt.

Si vous vouliez tester, il suffit de s'inscrire sur le site web du CECI. Une fois que l'inscription est validée, vous recevez une clef SSH qui permet de se connecter à n'importe quelle machine du CECI (ca fonctionnera aussi pour NIC très bientôt paraît-il). J'ai également commité la config HMEM dans le linuxbin pour faciliter la configuration des modules utilisés.

Remarques:

  • La version hmem-icc.cmake n'utilise ni VTK ni Qt. J'ai désactivé geniso (je pense que geniso nécessite VTK).
  • La version hmem-icc.cmake utilise les TBB loops (à désactiver pour des tests qui ne supportent pas cette option, comme le thermomec p expl.)
  • La batterie n'est pas passée (j'ai juste testé cont2 sur le master node)
  • Le master node s'appelle hmem00.
  • launch.py n'a pas encore été adapté (ces machines n'utilisent pas SGE mais SLURM).

Divers

  • J'ai commentarisé des #pragma omp qui restaient dans l'ALE. Ces commentaires seront utiles pour paralléliser en TBB.
  • Luc m'a donné 2 modifs du code pour compiler avec des nouvelles versions de gcc en debug.
  • Ajout de _ _init_ _.py dans apps.XFEM.complex pour pouvoir lancer le test va l'interface graphique.

Romain BOMAN 2014/01/16 07:40

commit/2014/01_16.txt · Last modified: 2016/03/30 15:23 by 127.0.0.1

Donate Powered by PHP Valid HTML5 Valid CSS Driven by DokuWiki