LoV – Log visualisation Programme Datavisualisation #1, 2015


Éléments de contexte

« La simulation numérique est, depuis les origines de l’informatique, un des piliers de la démarche scientifique. De nombreuses disciplines, que ce soit en climatologie, en géologie, en biologie moléculaire ou en astrophysique, se reposent sur l’outil informatique pour modéliser les phénomènes étudiés. L’industrie s’est emparée de cet outil pour remplacer les expérimentations coûteuses (crash tests, essais aérodynamiques en soufflerie, forages pétroliers, etc.) par des simulations équivalentes. Toutes ces simulations numériques utilisent le calcul hautes performances (en anglais, High Performance Computing, ou HPC) afin de réduire la durée de la simulation. En effet, une simulation peut nécessiter l’équivalent de plusieurs mois de calcul. Plutôt que d’effectuer tous les calculs sur une machine, les techniques employées en HPC consistent à découper les calculs afin de les répartir sur plusieurs machines travaillant en parallèle. On peut ainsi espérer diviser le temps d’exécution d’une simulation par 1000 si l’on utilise suffisamment de machines.

Le développement d’applications parallèles exploitant efficacement un supercalculateur est toutefois une tâche compliquée. Ainsi, si l’on répartit les calculs sur 4 machines, il arrive fréquemment que le temps d’exécution ne soit pas divisé par 4. Cela est généralement dû à des phases de synchronisation entre les machines : lorsqu’une machine a besoin d’un résultat calculé par une autre machine, un échange de messages passant par le réseau est nécessaire. Il est donc fréquent que le développeur d’applications doive analyser l’exécution de son programme afin de trouver l’origine du problème de performance. Pour cela, il peut utiliser des outils tels qu’EZTrace (Trahay, 2011). Ce type d’outils permet d’exécuter une application et d’en capturer les événements importants (phases de calcul, communications réseau, etc.) afin de générer des traces d’exécution. Ces traces peuvent ensuite être visualisées par le développeur afin qu’il puisse trouver la source du problème de performance. […]

Le but de ce projet est de définir une représentation des traces d’exécution de façon à ce que l’utilisateur ne soit pas submergé d’informations et puisse repérer l’origine des problèmes de performance d’une application parallèle. »

– Extrait de l’article « exploration visuelle des traces de calcul haute performance», François Trahay, Eve-Lise Kern, Kévin Zanin, publié dans l'ouvrage Datalogie, éd. Loco, 2016

Design de l’interface

Prototype

Capture vidéo commentée du prototype fonctionnel du logiciel, février 2016 :

Démarche de création

Communication de François Trahay, Eve-Lise Kern et Kevin Zanin au colloque Datalogie, octobre 2015 :

Le projet LoV se poursuit en 2016 au cours d’une deuxième itération dédiée à la visualisation de motifs (ou patterns) récurrents dans les traces de calculs.

Un projet du programme Datavisualisation
Esad de Reims
Télécom SudParis / IMT

Designers graphiques
Eve-Lise Kern
Kevin Zanin

Ingénieurs
Rindra Andriamanefo
Alexis Colin
François de Greef
Mathieu Henriette

Chercheur
François Trahay, département d'informatique de Télécom SudParis

Organisation & supervision
Olaf Avenati - Esad de Reims
Michel Simatic - Télécom SudParis / IMT