queuing_mutex
en remplacement du spin_mutex
dans StrMatrixLoopBody
StrVectorLoopBody
(défini à spin_mutex
pour l'instant)set_num_threads(n)
en mkl_domain_set_num_threads ( 1, MKL_DOMAIN_ALL )
et mkl_domain_set_num_threads ( n, MKL_DOMAIN_PARDISO )
(soit les blas ne seront parallèles QUE sur le solveur PARDISO)kmp_set_blocktime(0)
qui défini le temps durant lesquels les threads OPENMP “tournent à vide” avant de s'éteindre (défaut 200ms) qui était la cause principale du ralentissement de Metaforlock
sur la phase d'assemblage uniquement (le plus tard possible)int CSRMatrix::findIndex(int i, int j)
void CSRMatrix::append(std::vector<int> index, std::vector<double> vals)
void CSRMatrix::assemble(int i, int j, double val)
findIndex
& append
machine | Solveur | Tbb | Blas (mkl) | Real | User |
---|---|---|---|---|---|
corto | DSS | 1 | 1 | 374 | 375 |
Thorgal (gomp) | DSS | 1 | 1 | ||
Thorgal (iomp) | DSS | 1 | 1 | ||
blueberry | DSS | 1 | 1 | 608 | 610 |
corto | DSS | 1 | 6 | 150 | 528 |
Thorgal (gomp) | DSS | 1 | 8 | 171 | 800 |
Thorgal (iomp) | DSS | 1 | 8 | 171 | 849 |
blueberry | DSS | 1 | 4 | 264 | 818 |
corto | DSS | 6 | 6 | 114 | 549 |
Thorgal (gomp) | DSS | 8 | 8 | 284 | 1982 |
Thorgal (iomp) | DSS | 8 | 8 | 126 | 863 |
blueberry | DSS | 4 | 4 | 220 | 822 |
corto | DSS | 6 | 1 | 339 | 386 |
Thorgal (gomp) | DSS | 8 | 1 | 641 | 705 |
Thorgal (iomp) | DSS | 8 | 1 | 552 | 608 |
blueberry | DSS | 4 | 1 | 565 | 612 |
corto | SymDSS | 1 | 1 | 231 | 232 |
Thorgal (gomp) | SymDSS | 1 | 1 | ||
Thorgal (iomp) | SymDSS | 1 | 1 | ||
blueberry | SymDSS | 1 | 1 | 358 | 359 |
corto | SymDSS | 6 | 6 | 76 | 324 |
Thorgal (gomp) | SymDSS | 8 | 8 | 162 | 1026 |
Thorgal (iomp) | SymDSS | 8 | 8 | 86 | 551 |
blueberry | SymDSS | 4 | 4 | 136 | 494 |
_theWDirRoot
sur le wdir de la fonction setDir
)apps.remeshing
/ apps.welding.complex
/ apps.biomec.complex
/ apps.XFEM.complex
pour que tous les résultats / fichiers temporaires soient contenu dans un répertoire relatif au test du workspaceA : oo_meta\CMake\FindIOMP.cmake R : oo_meta\CMake\natacha.cmake
A : oo_meta\apps\parallel\largeTubeDssTbb1Blas.py A : oo_meta\apps\parallel\largeTubeDssTbbBlas.py A : oo_meta\apps\parallel\largeTubeDssTbbBlas1.py A : oo_meta\apps\parallel\largeTubeSymDssTbbBlas.py R :
— Luc Papeleux 2014/09/16