# Data Scientist
Famille:
Sous-famille:
Métier:
Code Métier: M1403
Code GESFORM GPMC:
## Préambule

[A lire: Les metiers de la data](https://corporate.apec.fr/files/live/sites/corporate/files/Nos%20%C3%A9tudes/pdf/Les-metiers-de-la-data.pdf)
## Définition
Le Data Scientist a pour objectif d’analyser et d’exploiter les données mis à disposition par l'ingenieur data en utilisant ses connaissances en statistiques et en machine learning.
## Spécificité
Au sein du Centre de données cliniques de Brest, le Data scientist sera chargé d'extraire et d'analyser les données médicales localisées dans le lac de donnée. Sa mission principale sera de générer de l'information à partir de données structurées et non structurées.
## Environement et contexte de travail
### Liens hiérarchiques
- Responsable du CDC :
- Cadre du département d'information Médicale:
### Liens fonctionnels
- Les ingenieurs datas du centre de donnée clinique ( Nathan Fouliquer )
- Les équipes du DIMs
- Les équipes de recherches
### Horraire
- 9h - 17h
### Congés
programmation des congés annuels et des RTT à faire avec le cadre administratif en coordination avec ses collègues et en tenant compte des contraintes de service.
### Télétravail
le télétravail est possible après accord de l’encadrement du service et en conformité avec les règles définies pour le CDC en lien avec l’institution.
## Moyen techniques mis à disposition
Le data scientist disposera d'une station de travaille sous Linux pour réaliser ses analyses et concevoir des modèles de machine learning. Il aura un accès au lac de données ainsi qu'à un serveur de calcul disposant de GPU pour réaliser des calculs complexes.
## Mission principale
- Extraction des données
- Transformation des données avec python/pandas
- Traitement d'information non structurées (textes, images)
- Faire des analyses descriptives
- Constuire des modèles prédicives
- Produire des graphiques
- Utilisation de notebook Jupyter
- Versionner son code sur GitLab
## Formation initiale requise
### Diplome
informatique / bioinformatique / intelligence artificielle (Bac + 8)
### Experience
- Utilisation d'un environement Linux (Connaissance détaillée)
- Programmation Python (Connaissance détaillée)
- Sklearn, PyTorch, TensorFlow, Keras (Connaissance détaillée)
- Manipulation des données en Python avec Pandas (Connaissance détaillée)
- SGBD SQL (Connaissance détaillée)
- Jupyter notebook
- Git
### Connaissance
- Traitement automatique du langage naturel (TAL / NLP)
- Apprentissage non suppervisé
- Apprentissage suppervisé
## Savor-faire
- Etre autonomme dans l'apprentissage des technologies
- Rédiger de la documentation
- Assurer une veille scientifique
## Qualité requises
- Sens du relationnel et du travail en équipe.
- Discrétion et Respect du secret professionnel médical
- Curiosité intellectuelle
- Esprit Geek