--- tags: Semaine-Entreprise, ICE --- # [Entreprise] HP Enterprise (2) ``` Intervenant : Jean Pourroy, Doctorant Entreprise : HP Entreprise ``` ## Informations essentielles ### Thèse #### Présentation de sa thèse et calcul haute performance - état de l'art (1 an) : nouvelles technologies, manques, Benchmarking ![](https://i.imgur.com/TJ4pVKG.png) - calcul haute performance, très en lien avec la simulation numérique, car la qualité de la simulation dépend de la puissance de calcul - agrégation de ressources individuelles - utilisation par ex dans le test de crash d'automobiles, rendu de films (Avatar a mis 1 semaine), physique théorique (trous noirs), médecine ![](https://i.imgur.com/vOlTRuA.png) - Thèse réalisée dans une équipe de construction et vente de supercalculateurs à Grenoble ![](https://i.imgur.com/XP9j2ez.png) - 1 FLOPS = 1 opération par seconde. 1 infra : 10^18 FLOPS = exaflops - chaque année on génère 2x plus de données que l'année précédente - nécessité d'une grosse puissance de calcul pour faire de la recherche, il faut des données rapidement ![](https://i.imgur.com/E8xJOd7.png) - 10^18 flops, Exascale #### Exascale : défis et opportunités - difficultés ? avant 2013 : pussiance augmentait linéairement, x1000/11 ans. maintenant : x1000/23 ans - HPL : chiffre en flops pour connaître la puissance de calcul max qu'elle peut atteindre ![](https://i.imgur.com/MXjAwLU.png) - La perf des processeurs a augmenté, mais beaucoup plus vite que les bus mémoires - multi-core, caches mémoire ##### Défis ![](https://i.imgur.com/iHPAMsV.png) - Coût - Energie : doit consommer entre 20 et 30 MW, alors qu'il faudrait 350 MW - Complexité : les programmeurs ont du mal à bien les utiliser. Nombreuses couches logicielle pour pouvoir l'utiliser - Technologies : - Storage Class Memories : rencontre RAM/FLASH - Architectures Optimisées : augmenter la performance/Watt par l'hétérogénéité - technologie photonique : fibre optique permet d'augmenter le débit... - GenZ protocole permettant de connecter toutes les technos d'un supercalculateur - Vitesse - Expertise ![](https://i.imgur.com/u07kHfX.png) ##### Résumé ![](https://i.imgur.com/bQrRI9a.png) ### Méthodologie en 5 étapes ![](https://i.imgur.com/Vxu3eGM.png) - outils développés - principales étapes - veille technologique des dernières innovations - caractéristiques clé des architectures à analyser : 1. Bande passante mémoire économique : nb de gb par bus mémoire par dollar investi 2. Puissande calcul FLOPS 3. Equilibre arithmétique (ratio entre les deux précédents) 4. Efficience énergétique (FLOPS / Watt) - caractérisation de l'architecture: Benchmark pour mesurer la perf max On s'intéresse au calcul et à la mémoire. Outil de mesure de la perf max personnalisé : ![](https://i.imgur.com/7Tc7c8v.png) - Permet de vérifier les performances théoriques - Caractériser l'execution de différentes instructions - Comparaisons de deux FPU Outil de mesure mémoire personnalisé : DML_MEM ![](https://i.imgur.com/rIBoC7A.png) - Mesurer la taille d'une ligne de cache - Mesurer l'impact du compilateur sur le débit mémoire - Eval. de la performance de différentes tailles de stride - Mesure du débit mémoire maximal atteignable ![](https://i.imgur.com/A7MSqVb.png) Extraction et modélisation des Kernels Outil custom : Oprofile++, basé sur Oprofile. Voir **Roofline Model**, qui permet de voir si un système est limité par la performance de calcul ou par la mémoire. ![](https://i.imgur.com/9udpSEX.png) ----- ![](https://i.imgur.com/G04cdbD.png) ## Jobs / Offres de Stages Il répond aux questions sur les thèses. ### En France #### CDI #### Stage #### Etc ### À l'étranger #### CDI #### Stage #### Etc