Reseach Intership : proposals for Master students

Round-to-Nearest HiPerf BLAS

Objectif du stage :

Des algorithmes récents permettent la meilleure précision possible de la somme de n flottants, et donc du produit scalaire, avec des performances intrinsèques extrêmement prometteuses. Ces algorithmes permettent-ils, en pratique, de concilier meilleure précision et performance pour les architectures multicore x86 ou hybride multicore-GPU ? 

Il s'agira d'abord de dégager d'un état de l'art les BLAS de références pour les architectures visées et de définir un ensemble de benchmarks pour ces BLAS précises. Le corps du stage consistera à développer les versions précises de ces BLAS (Round-to-Nearest BLAS) et étudier comment profiter au mieux des architectures visées selon les différents algorithmes précis. On s'intéressera en particulier à la génération automatisation de ces versions optimisées selon les architectures (auto-tuning). La reproductibilité des évaluations est une contrainte forte de ce travail qu'il conviendra de garantir a priori.

On se concentrera sur une architecture (x86, GPU, au choix du stagiaire). Les développements seront réalisés en C. Les expérimentations sur architecture hybride profiteront des moyens de calcul HPC@LR

Prérequis : 

Des connaissances sur les sujets suivants peuvent aider mais ne sont pas indispensables : arithmétique des ordinateurs, parallélisme, algorithmique numérique, algèbre linéaire numérique, compilation, architecture des ordinateurs

Lieu :

Equipe DALI, Université de Perpignan. Laboratoire LIRMM, UMR 5506 - CNRS - U. Montpellier 2.

Encadrant :

Philippe LANGLOIS

Thématique, domaines scientifiques, mots-clés :

calcul scientifique, validation numérique, arithmétique des ordinateurs, parallélisme, unités matérielles pour le calcul haute-performance

Premiers éléments de bibliographie :

http://en.wikipedia.org/wiki/Basic_Linear_Algebra_Subprograms

http://www.stodden.net/AMP2011/

http://www.netlib.org/xblas/

http://mplapack.sourceforge.net/

http://icl.eecs.utk.edu/magma/

https://www.hpc-lr.univ-montp2.fr/presentation-des-services/un-superculateur-hybride-de-technologie-recentes-et-innovante-12

D. Bailey, R. Lucas, S. Williams. Performance Tuning of Scientific Applications. CRC Press. 2011.

N. Higham. Accuracy and Stability of Numerical Algorithms. 2nd. ed. SIAM. 2002.