# Création d'une unité d'analyse des données au sein du CDC
## Objectif
Les données cliniques et biologiques collectées par les établissements de santé dans le cadre de la prise en charge des patients sont le plus souvent non exploitées. En effet, la santé reste, par défaut, un domaine où le numérique n’est pas encore complètement implanté.
De ce constat sont nées les projets d'entrepot de données de santé (EDS) et notamment le Health Data Hub qui vise à centraliser et harmoniser l'ensemble des données de santé sur le plan national.
À Brest et dans les autres CHU du Grand Ouest, la solution commercial eHOP a été déployé et vise à plus long terme à aggréger les données des entrepots locaux dans le cadre du Ouest Data Hub.
Cette solution est administré aujourd'hui par le CDC et la société Enovacom. Elle se compose principalement d'une base de donnée oracle alimenté au fil de l'eau par des données de santé et d'un portail web permettant de l'interroger facilement.
L'objectif du CDC consiste à guider les chercheurs sur ce portail en s'assurer des démarches administratives. A l'heure actuelle, le CDC n'a pas pour vocation d'exploiter elle même les données. Ce qui est regretable aux regards des nouvelles technologies d'analyse de données massives, comme l'intelligence artificielle que seul un service comme le CDC pourrait réaliser.
Je propose ainsi de créer une unité d'analyse de données au sein du CDC à moindre coût en partant d'une infrastructure déjà existante (serveur de calcul) et en s'affranchissant de toutes utilisations de logiciels commerciaux ( solution opensource ).
Cette unité répondra aux differentes demandes des services que ce soit pour le soin ou pour des projet de recherche. Il pourra s'agir par exemple de demande pour avoir un suivi de metric en temps réel sur des dashboards, de réaliser des analyses bioinformatiques ou encore la création de modèle prédictif pour l'aide au diagnostic.
## Infrastructure
### Serveurs de calculs
L'objectif a long terme est de construire pas à pas un cluster de calcul hospitalier hébérgé par la DSI. A l'heure actuel, nous pouvons déjà commencé avec l'existant. J'ai déjà recyclée deux serveurs de calculs actif situé dans le laboratoire de génétique moléculaire. Ils sont utilisés actuellement pour des analyses bioinformatique ponctuelle et pour la restitution de résultat via des pages web dynamique. Un autre serveur de calcul est en cours d'acquisition par la DSI. D'autre serveur de calcul sont disponnible au CDC
- Slurm
- Spark
- Apache
### Logiciels opensource
- En accord avec la reglementation d'utiliser que de l'opensource, de etc ...
- Notebook jupyter Python et R
- restitution des dashboard avec graphana
- restitution via des pages web hébérgé par gitlab
## Cycle de vie d'un projet
Tous les projets seront guidé par gitlab.
Par service, y aura un truc
### Demande
On demande depuis jira, ca crée l'issue sur gitlab ..
### Analyses
Les analyses sont réalisé avec jupyter et autre
Les taches de fond avec de job cron
### Restitution des résultats
- support
- securité
## Example de projet
### Suivi de l'épidemie de covid
- Dashboard temps reel
- Apparition de nouveau variants
## Integration des données cliniques et génomique
- Exomes
## Origine des hémolyse sur tube sang
## Conclusion
- Autre projets pharmaco, etc ..
- Valoriser le patrimoine de donnéee
- Faciliter l’usage des données
- protéger les données des patients
- innover avec l’ensemble des acteurs.
## Fonctionement de l'unité
### Gitlab
Tous les projets de l'unité seront réalisés sur une instance local de gitlab. Cette outil gratuit et largement répondu permet la gestion d'un projet depuis sa création jusqu'à son rendu.
- les tickets de demande créés depuis JIRA seront synchronisés automatiquement sur gitlab.
- la validation des demandes se fera en amont (soin ou recherche)
- Un site web avec des resources documentaires et pédagogique seront disponible sur gitlab.
- Les analyses demandés seront réalisés sur des notebook Jupyter et versionné sur gitlab.
- La restitution des données analysées pourra se faire selon differente modalité:
- Par une page web local pour les résultats dynamique
- Par gitlab ou le gestionnaire de ticket Jira
- Par dossier partagés
-
### Cluster de calcul
- Proton
- Dawkins
- DSI commandé
### Outils d'analyses
- Linux
- L'accès aux differentes sources de données se fera depuis le cluster de calcul
- Les analyses seront réalisés en Python ou en R suivant les affinités.
- Les Dashboard de rendu dynamique seront réalisé avec Grafana
-
### Sécurisation
- Le serveurs de calcul seront accessibles uniquement via une clef ssh asymétrique ( voir double authentification)
- le rendu des résultats sensibles seront cryptés et signés avec une clef GPG. L'annuaire GPG étant fourni par gitlab.
## Examples
- Portail Bioinformatique
- DashBoard COVID
- NGS covid
- Biochimie
- Service
## Projets Future
- Antibiogrammes hospitaliers
- MultiOmics
Dashboard
Gitlab
Securisation
- Le CDC n'a pas pour objectif de faire du BIG DATA / IA
AXE:
Valoriser le patrimoine de donnéee
Faciliter l’usage des données
protéger les données des patients
innover avec l’ensemble des acteurs.
Faciliter l'acces tout en préservant la sécurité et la reglementation
Introduction
- Les progrès technolgique produisent quantités d'information enrome.
- "En effet, la santé reste, par défaut, un domaine où le numérique n’est pas encore complètement implanté."
- Les sources multiples
## Technique
OpenStack
S'entrainer avec rastberry Pi
SaltStack
## Education
Stagiaire depus les ecoles XXX
Formation des internes
## Ethique et IA
Invitation de thomas
## Hospitalier
## Universitaire
## Outil
- opensource ( )
dataGrid mamogrid
https://sill.etalab.gouv.fr/catalogue
## idée
https://www.pwc.fr/fr/decryptages/data/les-big-data-au-service-de-la-sante-quoi-de-neuf-docteur.html
"En effet, la santé reste, par défaut, un domaine où le numérique n’est pas encore complètement implanté."
## Definition
ensemble des données médico-biologistes
- Identification de facteur de risque
- Aide au diagnostic, aide à la décision
- Suivi de l'efficacité des traitement
- Pharmacovigilence
## Sécurité
- anonimisation
- Signature / cryptographie : GPG
- reglementation : RGPD
https://www.cnil.fr/fr/declaration/mr-004-recherches-nimpliquant-pas-la-personne-humaine-etudes-et-evaluations-dans-le
Type d'étude :
- Grande cohorte
## Defi de stockage et de calcul
Utilisation de standard :
- i2b2
# Utilité
Mieux prévenir et prendre en charge les maladies
Prédire des épidémies ( HealthMap)
- Pharmacovigilance : optimisation de la surveillance et de la prévention des risques d’effets indésirables,
- Aide au diagnostic et à la prise de de décision par les professionnels de santé,
- Détection de parcours atypique pour identifier les cas de maladies rares,
- Enrichissement de programmes de recherche clinique et épidémiologique,
- Développement de nouveaux produits et services de santé,
- Détection de signaux faibles pour prévenir les épidémies,
- Analyse du parcours de soin pour améliorer la qualité du système de prise en charge, etc.
aide au diagnostic
prévention de maladies et épidémies
personnalisation de l’expérience patient, etc.
## Liens
SNDS : https://www.snds.gouv.fr/SNDS/Accueil
Health Data Hub
Ouest Data Hub
Data Challenge
Docteur Frédéric Staroz
Visiomel
Recherche mutation du gène BRAF depuis une coupe anapath.
1. Rédiger une synthèse
La synthèse sert d’introduction à votre proposition de projet. Semblable au résumé d’un rapport ou à l’introduction d’un essai, cette section doit résumer ce qui va suivre et convaincre les parties prenantes de poursuivre la lecture du document. Selon la complexité du projet, votre synthèse peut comporter un ou plusieurs paragraphes.
Parmi les éléments essentiels à votre synthèse :
La problématique que votre projet cherche à résoudre
La solution apportée par votre projet à cette problématique
L’impact espéré de votre projet
Abordez ces points brièvement dans votre synthèse, car vous y reviendrez plus en détail ultérieurement.
2. Préciser le contexte du projet
Il est temps de détailler le contexte du projet. Ajoutez des références et des statistiques pour convaincre votre lecteur que la problématique à laquelle vous comptez répondre en vaut la peine.
Voici quelques questions à vous poser :
À quelle problématique votre projet répond-il ?
De quelles informations disposez-vous déjà à propos de cette dernière ?
Qui a déjà abordé cette question auparavant/quelles sont les recherches qui ont été menées à ce sujet ?
Pourquoi les recherches antérieures n’ont-elles pas suffi à résoudre cette problématique ?
C’est également le moment idéal pour expliquer dans quelle mesure la problématique envisagée est directement liée à votre organisation.
3. Présenter une solution
Vous venez de présenter votre problématique. En toute logique, l’étape qui suit vous invite à proposer une solution. C’est l’occasion de décrire plus avant votre approche pour le projet envisagé.
Parmi les éléments à inclure :
L’énoncé de vision pour ce projet.
Un calendrier de projet, sans oublier de préciser les jalons clés.
L’exposé des rôles et responsabilités de l’équipe projet.
Un registre des risques pour préciser comment vous comptez limiter les risques liés au projet.
Les livrables.
Les outils de génération de rapports que vous emploierez tout au long du projet.
Vous n’aurez sans doute pas besoin de l’ensemble de ces éléments, tout dépend de la portée de votre projet. Incluez les ressources pertinentes en fonction de cette dernière. Cette partie sera probablement la plus longue et détaillée de votre proposition de projet, car vous y aborderez tous les aspects essentiels pour assurer la bonne mise en œuvre de la solution envisagée.
Essayer la gestion de projet sur Asana
4. Définir des objectifs et livrables de projet
La définition des livrables de votre projet est une étape cruciale dans la rédaction de votre proposition. Les parties prenantes souhaitent découvrir ce que vous allez produire en fin de projet : produit, programme, mise à niveau technologique, entre autres. À mesure que les parties prenantes découvrent votre vision, elles comprennent comment et dans quelle mesure vous allez employer les ressources qu’elles ont fournies.
Voici quelques éléments à faire figurer dans la description de vos livrables :
Le produit final attendu ou l’objectif ultime de votre projet.
Une chronologie de projet indiquant à quel moment les livrables seront prêts.
Des objectifs SMART cohérents avec les livrables que vous allez produire.
Présenter la problématique et la solution de votre projet sont deux étapes essentielles, certes, mais définir précisément vos livrables permet aux parties prenantes de se faire une idée plus claire du projet.
5. Indiquer les ressources dont vous avez besoin
Problématique, approche, solution et résultats attendus… Tous sont désormais définis ; il est donc temps de préciser les ressources dont vous allez avoir besoin pour mener à bien votre projet.
N’oubliez pas d’évoquer les éléments suivants :
Le budget : il englobe aussi bien le matériel dont vous aurez besoin pour concevoir un produit, que les coûts publicitaires ou encore les salaires des membres d’équipe. Vous devez inclure tous les postes budgétaires essentiels pour mener à bien le projet.
La répartition des coûts : inclut les recherches menées pour justifier la demande de ressources spécifiques pour ce projet. Ainsi, les parties prenantes comprennent mieux en quoi leur participation est cruciale et joue un rôle dans la réussite du projet. Enfin, répartir les coûts permet de limiter les dépenses imprévues.
Le plan d’allocation des ressources : rédigez dans les grandes lignes votre plan et indiquez comment vous allez répartir ces ressources projet clés. Par exemple, si vous avez besoin de 50 000 € pour mener à bien votre initiative, indiquez comment vous allez subdiviser cette somme : salaires, logiciels, matériaux, etc.
À ce stade, vous avez déjà obtenu l’approbation des parties prenantes (en tout cas, nous l’espérons !). C’est la raison pour laquelle il est plus judicieux d’aborder les ressources projet nécessaires à la fin de votre proposition.
6. Établir une conclusion
Rédigez une conclusion convaincante et assumée pour clore votre proposition de projet. Comme la synthèse, la conclusion résume brièvement la problématique à laquelle répond votre projet et la solution proposée pour la résoudre. N’hésitez pas à mettre en évidence l’impact attendu de votre projet, sans dévier du sujet. La conclusion doit rester ciblée et pertinente, comme c’est le cas dans un essai traditionnel.