---
tags: Semaine-Entreprise, ICE
---
# [Entreprise] HP Enterprise (2)
```
Intervenant :
Jean Pourroy, Doctorant
Entreprise :
HP Entreprise
```
## Informations essentielles
### Thèse
#### Présentation de sa thèse et calcul haute performance
- état de l'art (1 an) : nouvelles technologies, manques, Benchmarking

- calcul haute performance, très en lien avec la simulation numérique, car la qualité de la simulation dépend de la puissance de calcul
- agrégation de ressources individuelles
- utilisation par ex dans le test de crash d'automobiles, rendu de films (Avatar a mis 1 semaine), physique théorique (trous noirs), médecine

- Thèse réalisée dans une équipe de construction et vente de supercalculateurs à Grenoble

- 1 FLOPS = 1 opération par seconde. 1 infra : 10^18 FLOPS = exaflops
- chaque année on génère 2x plus de données que l'année précédente
- nécessité d'une grosse puissance de calcul pour faire de la recherche, il faut des données rapidement

- 10^18 flops, Exascale
#### Exascale : défis et opportunités
- difficultés ? avant 2013 : pussiance augmentait linéairement, x1000/11 ans. maintenant : x1000/23 ans
- HPL : chiffre en flops pour connaître la puissance de calcul max qu'elle peut atteindre

- La perf des processeurs a augmenté, mais beaucoup plus vite que les bus mémoires
- multi-core, caches mémoire
##### Défis

- Coût
- Energie : doit consommer entre 20 et 30 MW, alors qu'il faudrait 350 MW
- Complexité : les programmeurs ont du mal à bien les utiliser. Nombreuses couches logicielle pour pouvoir l'utiliser
- Technologies : - Storage Class Memories : rencontre RAM/FLASH
- Architectures Optimisées : augmenter la performance/Watt par l'hétérogénéité
- technologie photonique : fibre optique permet d'augmenter le débit...
- GenZ protocole permettant de connecter toutes les technos d'un supercalculateur
- Vitesse
- Expertise

##### Résumé

### Méthodologie en 5 étapes

- outils développés
- principales étapes
- veille technologique des dernières innovations
- caractéristiques clé des architectures à analyser :
1. Bande passante mémoire économique : nb de gb par bus mémoire par dollar investi
2. Puissande calcul FLOPS
3. Equilibre arithmétique (ratio entre les deux précédents)
4. Efficience énergétique (FLOPS / Watt)
- caractérisation de l'architecture:
Benchmark pour mesurer la perf max
On s'intéresse au calcul et à la mémoire.
Outil de mesure de la perf max personnalisé :

- Permet de vérifier les performances théoriques
- Caractériser l'execution de différentes instructions
- Comparaisons de deux FPU
Outil de mesure mémoire personnalisé : DML_MEM

- Mesurer la taille d'une ligne de cache
- Mesurer l'impact du compilateur sur le débit mémoire
- Eval. de la performance de différentes tailles de stride
- Mesure du débit mémoire maximal atteignable

Extraction et modélisation des Kernels
Outil custom : Oprofile++, basé sur Oprofile.
Voir **Roofline Model**, qui permet de voir si un système est limité par la performance de calcul ou par la mémoire.

-----

## Jobs / Offres de Stages
Il répond aux questions sur les thèses.
### En France
#### CDI
#### Stage
#### Etc
### À l'étranger
#### CDI
#### Stage
#### Etc