owned this note
owned this note
Published
Linked with GitHub
# Consolidation, diffusion et valorisation
## Contributeurs
François Dubois, Mathieu Leclaire, Claire Lesieur, David Vandergucht
## Mots-clés
formation, logiciels, données, banc d'essais
## Introduction
Les dernières itérations des feuilles de route ont permis de dégager les grandes idées, fédérer la communauté et spécifier les grandes questions et les grands thèmes. La mission initiale du RNSC était d'essaimer en créant des instituts des Systèmes Complexes sur le territoire français. Nous pouvons estimer aujourd'hui que cette mission est un succès, avec la création de 7 instituts.
Il s'agit maintenant de consolider le réseau, diffuser la connaissance et les outils, et le valoriser auprès des acteurs publics et du monde économique.
Nous proposons plusieurs orientations pour mettre en oeuvre ces objectifs.
- la formation au sens large par la vulgarisation, l'enseignement et la formation continue vers l'intérieur et l'extérieur de la communauté SC
- la consolidation, par la mise en commun entre les ISC et vers les partenaires, d'outils, de méthodes, de services, d'infrastructures.
- la valorisation, grâce à la mise en oeuvre de prestations de conseils, via la création de startups par exemple.
## Formation au sens large
Nous avons considéré le mot "formation" en un sens très large : introduction via la vulgarisation, fondamentaux via l'enseignement traditionnel et formation continue.
### État des lieux
#### Vulgarisation / communication
- Fête de la Science
- Articles de presse, journal télévisé (intervention sur TF1 deux jours avant le second tour de l'élection présidentielle) autour de l'outil politoscope (https://politoscope.org/press/).
#### Enseignement existant
- Des formations au niveau master existent déjà. Par exemple, celle de l'[IXXI-ENS Lyon](http://www.ixxi.fr/enseignement).
- La formation [master Système Complexe Erasmus-mundi](https://www.polytechnique.edu/en/master-complex-systems) en collaboration avec l'école Polytechnique
- Le Campus Numérique des sytèmes complexes [CS-DC])(https://www.cs-dc.org/)
#### Formation continue
Les [JEDI](https://iscpif.fr/events/formationsjedi/) sont des sessions courtes (une journée maximum) pour former aux outils développés en interne par l'ISC-PIF ou à des outils utiles à la communauté SC.
Les écoles d'été [MAPS](http://maps.hypotheses.org/) regroupe pendant une semaine des apprentis modélisateurs et les sensibilise à la modélisation multi-agent.
École de physique des Houches [Complex Networks Thematic School](http://leshouches2014.weebly.com/index.html)
### Défis
#### Vulgarisation / communication
La définition des termes liée aux systèmes complexes fait souvent débat. Il est pourtant nécessaire de s'accorder sur une vision que la communauté veut donner de ces termes. La communication autour de ces définitions doit donc pouvoir prendre plusieurs formes afin d'adresser ces différentes perspectives, échelles et niveaux de difficulté.
Au-delà de l'aspect formation en enseignement, la communication autour des systèmes complexes doit être l'objet d'un travail de vulgarisation, travail qui doit exploiter le multimédia (textes, dessins, vidéos) et les références multiples à des domaines d'applications divers (différentes "recettes" ou cas d'usage mettant en oeuvre une même méthode).
Cet effort de vulgarisation devrait être pris en charge par l'ensemble des instituts, à la fois sur le plan financier et en termes de production scientifique.
#### Enseignement
Nécessité de la mise en oeuvre de parcours d'enseignement académique afin d'avoir des étudiants se distinguants par leur formation des autres disciplines. C'est une étape nécessaire vers l'ouverture de formation académique specifique en systèmes complexes pour favoriser l'interdisciplinarité autour des thématiques couvertes par les SC.
Niveaux ciblés: licence, IUT, école d'ingénieur
Programme: interdisciplinarité, travaux communs et thématiques croisées autour des données, analyse de données et modélisation/simulation.
Logistique: à la carte, package horaire proposé par les ISC individuellement ou ensemble.
Étudiants concernés: toutes les disciplines
Pérennisation: stockage des cours, mise à disposition sur les sites ISC, école doctorale des systèmes complexes?
Exemple: "Prospective Study Program National University of Singapore"
Les étudiants de différentes disciplines niveau licence et master y suivent sous forme de 'mineur', un programme interdisciplinaire offert par des intervenants de différents départements. Le programme repose sur des liants entre disciplines (maths appliquées, physique appliquée, biologie des systèmes,) ou un enseignement décliné en gestion de données, analyse de données, modélisation et simulation.
#### Formation continue
Cibles:
- ISC
- Académiques
- Partenaires: Industries et organismes publics
Échelle de temps:
- au fil de l'eau: Jedi, formation CNRS, journées IXXI
- Ritualiser: école d'été, de printemps
Type d'actions:
- Workshop: techniques/utilisation d'outils (logiciel, traitement de données, représentation, etc.)
- Meeting: thématiques croisées
- Groupe de travail: traitement d'un problème spécifique.
Par exemple pour une formation Industrie/Académique:
Service aux entreprises: soumettre aux étudiants une question/un problème issue du monde économique et industriel pour tester et valoriser leurs expertises auprès des industries/institutions/public
Moyens:
- Intégration des écoles d'été dans les formations offertes par les grands organismes (EMBO, FEBS, etc.)
- Écoles doctorales
- Labelisation: les ISC pourraient envisager de demander un label européen pour valoriser la formation en systèmes complexes. Cette labellisation permet d'accéder à des soutiens financiers, une visibilité européenne et introduit une notion de qualité des formations.
## Consolidation
Les différents instituts ont orienté leurs recherches et ont créé au cours de leur développement des outils pour mettre en oeuvre des méthodes innovantes dans ces directions de recherches. Nous faisons ici un tour d'horizon des réalisations mutualisées de ces Instituts et nous proposons des axes de consolidations plus forts.
Après l'effort de l'essaimage des Instituts des Systèmes Complexes, dois venir le temps de la cohérence et de la mutualisation. Cette mise en commun doit être un médium pour définir les Systèmes Complexes, référencer les outils existants, mettre en commun les ressources de calcul et les ressources humaines. Au fil des années, les ISC ont développé des outils permettant de mieux observer, modéliser, simuler des systèmes complexes. Ils ont été pensés pour être génériques et transdisciplinaires.
### État des lieux
#### Systèmes complexes à l'international
Complex system Society (http://cssociety.org/home)
Young Researchers Network on complex system (http://yrncs.cssociety.org/)
#### Outils mutualisés
##### Bioemergences
[Bioemergences](http://bioemergences.iscpif.fr/bioemergences/index.php) est une plateforme regroupant des outils d'observation multiéchelles et multi-modales dans le cadre d'une modélisation de processus biologiques. USR3695 / ISCPIF
##### Gama
La plateforme [Gama](https://code.google.com/archive/p/gama-platform/) est une plateforme de modélisation agent permettant de décrire des règles d'interactions, de simuler et de visualiser des modèles multiagents. Gama est développée de concert par 5 entités [université de Rouen](http://www.univ-rouen.fr), [université de Toulouse](www.ut-capitole.fr), [université d'Hanoi](www.vnu.edu.vn/eng), [université Paris Sud](http://rplusplus.org/umr-8623/), [université de Can Tho](https://www.ctu.edu.vn/en)
##### GarganText
[GarganText](http://gargantext.org/) est une plateforme de data mining qui permet de rechercher des cooccurrences de termes dans un corpus de textes et de générer une carte interactive de proximités des termes. Elle permet par exemple de générer un état de l'art en quelques secondes selon une base d'articles. Son développement a été impulsé et financé par [l'ISC-PIF](iscpif.fr)
##### Graphstream
[Grahstream](http://graphstream-project.org/) est une librairie Java pour la modélisation et l'analyse de graphes dynamiques. Elle a été développée par [l'Université du Havre](https://www.univ-lehavre.fr/) en collaboration avec [l'Institut des Systèmes Complexes en Normandie](https://www.univ-lehavre.fr/)
##### LinkrBrain
[LinkrBrain](http://linkrbrain.org/) est un outil en ligne pour l'exploration et la visualisation de données neurologiques.
##### Multivac
[](https://multivac.iscpif.fr/) est une plateforme permettant d'accéder à de grandes quantités de données sous la forme d'API. Elle met à disposition des outils de traitement parallèle de ces données de manière polymorphe (Hadoop, Spark, etc). Elle a permis de générer des applications pour étudier [le climat](https://climate.iscpif.fr/), [les élections présidentielles 2017](https://politoscope.org/), etc. Son développement a été impulsé et financé par [l'ISC-PIF](iscpif.fr)
##### OpenMOLE
[OpenMOLE](http://openmole.org) est une plateforme d'exploration des modèles numériques. Initialement développée pour l'étude des modèles de systèmes complexes stochastiques, elle permet une approche générique pour explorer, optimiser et réaliser des analyses de sensibilité sur les modèles. OpenMOLE permet aussi de distribuer la charge de calcul des expériences numériques sur une grande variété d'architectures de calcul haute performance (serveur, cluster, grille de calcul, cloud, etc.). Son développement a été impulsé et financé par [l'Institut des Systèmes Complexes Paris Ile de France (ISC-PIF)](iscpif.fr)
##### à compléter
#### mise en commun de services
##### Services informatiques:
- Exemple à d'ISC-PIF: stockage et accès aux données: https://nextcloud.iscpif.fr/
- autre à compléter
##### Lieux mutualisés
- Exemple à l'ISC-PIF: réservations de salles de réunion, salles de séminaires (jusqu'à 60 personnes) et auditorium pour conférences (130 personnes).
#### Infrastructures mutualisées
Les expérimentaitons sytèmes complexes mettent en jeu des simulations lourdes en temps de calcul. Un effort de mutualisation des resources de calcul a été initié dès 2008 avec l'acquisition de machines pour le calcul sur grille de calcul ( [EGI](www.egi.euwww.egi.eu) ) par l'ISC-PIF. Des investissements logiciels pour permettre l'utilisation automatisé de ces resources ont été mis en place ([OpenMOLE](openmole.org)). Cette mutualisation répond bien au type de simulations réalisées dans la communauté: des batchs de simulations très importants sont réalisés en pic, laissant ensuite les infrastructures disponibles pour le reste de la communauté On observe depuis 10 ans une montée en charge de l'utilsation de ces resources sans encore arriver à une adoption massive. Cette adoption massive est étroitement liée à l'adoption des outils de calculs distribués. L'un n'ira pas sans l'autre.
Pour le moment, la mise en commun des outils et des méthodes se fait se fait depuis chaque ISC vers ses propres partenaires. Cependant chacun des Instituts a peu de visibilité sur les activités des autres.
### Défis
La mise en commun des outils *maison* et des outils préconisés devrait être renforcée entre les ISCs à l'échelle nationale. L'objectif est double: nous connaître mieux nous-mêmes: *que font les autres dans la communauté ?* et également mieux orienter les personnes s'intéressant aux SC en leur donnant des points d'entrée cohérents avec leurs centres d'intérêt.
#### Promouvoir les outils
Nous avons une connaissance partielle des outils développés par les autres instituts. Nous en avons fait une liste non exhaustive dans le paragraphe précédent. Nous préconisons cependant la création d'un point d'entrée dynamique recensant ces outils. Un site web mutualisé semble indiqué. Il pourrait permettre également de recommander des technologies. Citons de manière non exhaustive:
- [Netlogo](https://ccl.northwestern.edu/netlogo/): Plateforme de modélisation multiagent permettant de faire prototyper rapidement un modèle multiagent par des non-informaticiens
- [Gephi](https://gephi.org/) pour la visualisation des graphes complexes.
- [Spark](https://spark.apache.org/): framework de calcul distribué pour l'exploration de données massives.
Faire apparaître et mettre à jour ces recommandations dans une vitrine mutualisée permettrait d'avoir une vue *à jour*.
#### Promouvoir des pratiques
Un outil pour la communauté : une base de documents "hal"
Permettre le dépôt avant publication de documents de recherche juste terminée sur une sous-section de la base de données "HyperArchives en ligne" du Cnrs. Ceci permettrait de renforcer l'identité de la communauté des Systèmes Complexes.
##### Réaliser et publier des datasets
Rôle des ISC: encourager et accompagner les partenaires dans la réalisation des datasets.
Cet accompagnement peut se traduire par:
- une aide méthodologique: quelles sont les informations à fournir pour bien documenter la production du dataset ?
- une aide thématique: quels sont les datasets d'autres communautés qui peuvent servir un autre cas d'usage ? Peut-on s'en inspirer ?
- une aide technique: Proposer des solutions d'hébergement des données, des solutions de présentation et d'accès aux données.
##### Produire des données / du code pour le bien commun:
La réalisation de jeux de données à un coût. Il faut trouver un mode de rémunération qui permet de gratifier le producteur de données tout en garantissant que la donnée produite reste libre et gratuite. La gratification ne doit aller qu'au producteur de la donnée pour éviter le problème récurent des *rentiers de la donnée*. Les avancées en termes de cryptoéconomie (blockchain) laissent entrevoir un large champ d'investigation en ce domaine: des producteurs de données pourraient répondre à un appel à production de données via une certification contractuelle dans la blockchain servant de tiers de confiance. Le producteur serait rémunéré après validation pour sa production seule.
L'objectif ici est de traiter la donnée comme faisant partie prenante d'un ensemble de composants contribuant à la démarche scientifique, et doit donc être disponible pour permettre à la science d'être reproduite.
Pour faciliter le croisement des communautés, les données comme les programmes doivent être ouverts, mais cet aspect va parfois à l'encontre des politiques internes des partenaires. Une offre de conseil et d'accompagnement peut s'avérer nécessaire afin de présenter des modes opératoires rendant compatible la mise à disposition ouverte des données ou des codes tout en garantissant une viabilité économique (conseil, expertise ?)
##### Piloter la réalisation de benchmarks
La maîtrise d'une base de données permet ensuite une confrontation aux modèles issus d'autres communautés. À la façon de la communauté de traitement d'images, une base de données a un intérêt pour quelqu'un qui développe un nouvel outil et a besoin de le confronter au réel existant. Il lui suffit de contacter le responsable de la base de données (supposé bien connu !) afin d'avoir en retour la performance de son simulateur. Ce type d'intervention peut donner lieu à une rémunération à définir.
Proposer des plateformes d'évaluation comparée des algorithmes sur un jeu de donnée connu et partagé. Les ISC peuvent fournir l'infrastructure nécessaire à l'évaluation (automatique) des codes soumis sur des datasets privés, la publication des résultats. Example: [Kitti](http://www.cvlibs.net/datasets/kitti/), [Pascal VOC](http://host.robots.ox.ac.uk/pascal/VOC/)
#### Un défi : renforcer le réseau européen
Aux États-Unis, la biologie des réseaux, est fortement intégrée à la discipline "Science des Réseaux", ce qui lui donne de fait une reconnaissance claire dans la communauté des biologistes. Ce n'est pas aussi évidemment dans la communauté française. Le réseau des systèmes complexes peut-il être amené à jouer un tel rôle vis-à-vis des équipes de recherche qui participent de ses travaux ?
#### mise en commun d'infrastructures
En matière d'infrastructure technique, élargir l'offre pour mieux répondre à la diversité des besoins et prendre en compte que bien souvent, il n'y a pas chez les partenaires de moyens humains pour faire l'installation et la maintenance de "couches informatiques" nécessaires à, mais pas centrales dans le cadre des travaux de recherche. Exemple: Grille de calcul - > outil intégré de calcul distribué. Cloud: outil d'infrastructure, sur lequel tout est à bâtir. Il manque des niveaux intermédiaires (en s'inspirant des grands fournisseurs de service cloud): PAAS, Plateform as a Service et SAAS, Software as a Service.
#### Une dynamique de transfert
Les réseaux des Systèmes Complexes jouent-ils vis-à-vis de la recherche scientifique le rôle d'une direction de programme dans l'industrie ? On sait que ces grands comptes chargés de développer des systèmes artificiels "compliqués" comme une automobile ou un avion s'organisent sous une forme matricielle. D'une part, les directions de spécialités comme l'automatique, la mécanique, l'électromagnétisme, etc.) et d'autre part les directions de programme : un programme est associé au développement d'un produit commercialisé par l'entreprise ; il s'appuie sur les compétences existantes, suscite aussi des améliorations des compétences et a une durée de vie finie par nature. Avec un changement d'échelle qu'il conviendrait de définir, on peut se poser la question de savoir si des structures comme les ISC (ou l'INRIA qui a mis en place depuis longtemps une structure de recherche par projet) jouent le rôle d'une direction de programme dans le monde industriel. Ceci se caractérise par le fait d'admettre qu'un chercheur dans un laboratoire de Systèmes Complexes n'est pas le meilleur expert d'une discipline comme l'analyse des modèles, la statistique, l'optimisation ou la mise en œuvre informatique (il peut aller chercher l'information dans les laboratoires de spécialité) mais est capable de prendre en charge une question posée par un acteur social (monde politique, économique et social) et d'apporter des réponses qui peuvent se traduire par des "break through" économiques.
Par exemple, le jeu de paramètres d'un réseau de neurones formels constitue en soi une information très importante pour faire le lien avec les nouvelles applications.
Transférer de la connaissance, de l'expertise. Si on prend comme référence les niveaux de maturité technologique ou "Technology Readiness Level", il s'agit de passer typiquement du niveau 3-4 (le prototype qui fonctionne) au niveau 5-6 (participation à un futur produit qui sera commercialisé). La mise en place de structures commerciales est naturelle dans cette perspective.
## Valorisation
### État des lieux
#### Questionnement
Comment me convaincre de sortir de mon domaine métier pour utiliser d'autres méthodes SC pour résoudre mon problème ? --> problème de généralisation des connaissances et transfert.
Comment faire intervenir d'autres modèles (que je ne maîtrise pas) dans ma recherche et ainsi changer d'échelle ? --> problème d'interaction avec d'autres domaines, complexification des modèles.
### Défis
#### Un défi de service : l'audit complexité
A compléter
#### Valoriser les logiciels
Le développement d'outils comme Gargentext ou OpenMOLE est typiquement le résultat de cinq années de travail pour une équipe de deux ou trois chercheurs et ingénieurs. Le passage du développement à l'exploitation au service de nouvelles demandes peut induire un changement dans la façon de travailler. En particulier, le transfert de l'outil logiciel de son concepteur initial à une équipe chargée de l'entretenir, ou même commercialiser son utilisation. Bien entendu, ce type d'action demande des moyens humains spécifiques à mettre en place.
D'un point de vue humain, l'industrialisation ou même la simple consolidation d'un code de recherche par une équipe tierce peut être mal vécue (égo, dépossession de son travail) et peut être source de frictions. Le partage d'expérience, et les exemples inter communautaire peuvent aider ce processus nécessaire.
#### Valoriser les bases de données
Savoir passer d'une base de données gérée au niveau personnel à un outil partagé par une communauté. Le développement d'une base de connaissances est toujours un travail de longue haleine. La tentation pour une équipe qui a créé une telle base est grande de la conserver pour elle. On peut s'inspirer ici de l'expérience des biologistes et dépasser les réticences. Les expériences de rayons X afin de déterminer la structure des protéines demandent un effort expérimental très important. Comment partager ces données en rendant justice aux équipes qui les ont produites ? Une solution proposée par les biologistes (référence ?) est la suivante : la base de données devient publique, mais si elle est utilisée pour des travaux ultérieurs, l'utilisateur se doit de citer les travaux de ceux qui ont transmis leurs données. Un type de création de Bien Commun qui doit pouvoir être transposé aux Systèmes Complexes.
#### Un défi : se placer sur le marché
Création de "start-up"s, suite au succès d'un projet et à la demande d'utilisateurs issus du monde économique et administratif, sur le modèle des sociétés de service issues de l'INRIA pour fixer les idées. Même si les données sont publiques et les outils de simulation sont dans le domaine public, le savoir-faire acquis au cours des exploitations permet de gagner un temps indispensable pour des utilisations ultérieures. Par exemple, le jeu de paramètres d'un réseau de neurones formels constitue en soi une information très importante pour faire le lien avec les nouvelles applications.
Transférer de la connaissance, de l'expertise. Si on prend comme référence les niveaux de maturité technologique ou "Technology Readiness Level", il s'agit de passer typiquement du niveau 3-4 (le prototype qui fonctionne) au niveau 5-6 (participation à un futur produit qui sera commercialisé). La mise en place de structures commerciales est naturelle dans cette perspective.
## Conclusion
Une instance interinstitut, le RNSC par exemple, doit pouvoir fédérer les efforts de mutualisation et de vulgarisation afin de rendre plus lisible et cohérente notre vision de la discipline. Les objectifs sont multiples: i) mieux nous connaître entre instituts (nos forces, nos faiblesses, nos redondances), ii) mieux communiquer sur ce que nous sommes collectivement capables de proposer.
Nous préconisons donc la création d'un site web, coordonné par le haut, mais alimenté par les instituts. Il devrait y figurer la liste des instituts avec un lien vers leurs sites respectifs, des définitions communes des termes systèmes complexes (idéalement illustrés par des textes, dessins ou success-stories), une liste dynamique des outils mutualisés avec un renvoi pour leur apprentissage, une liste dynamique des formations à venir dans les différents instituts (où idéalement la localisation des formations sont croisées), la possibilité pour chaque laboratoire satellite d'écrire une page pour décrire sa contribution ou sa success-story SC, la liste dynamique des publications scientifiques système complexe, cette présente feuille de route. Cette liste n'est pas limitative.