---
tags: Semaine-Entreprise, ICE
---
# [Entreprise] Boston Consulting Group - MLOps : Comment obtenir la valeur de vos projets machine learning dans la vie réelle
```
Intervenant :
Niels Freier (Ex Epitech 2011)
Associate Director, AI Software Engineer
Entreprise :
Boston Consulting Group
```
## Informations essentielles
### Who are we ?
Il va plus parler de la partie approche.
BCG reste à la base du stratégie management mais a évolué en boîte qui créée des solutions et non plus seulement créée des prototypes (surtout avec la data science).
Ils transforment l'entreprise.
La partie complexité permet d'avoir une véritable complexité qui permet de rentrer assez profondément dans les sujets.

Accompagnement sur le long terme. Besoin d'ingé
Dans les grandes entreprises comme le BCG, on crée des produits (open source ou pas). Ces produits permettent d'aller beaucoup plus loin beaucoup plus rapidement (souvent open-source -> ils participent).
Le BCG est très international, pratique si on veut s'expatrier. Il faut absolument parler anglais couramment. Si on a une apétence pour vivre à l'étranger c'est pratique.

Beaucoup de variété de projets / domaines -> pratique pour apétences d'avoir un constant renouveau dans nos carrières.
### What makes AI hard ?
Bien plus de la moitié des projets / entreprises qui sont concernées n'y arrivent pas. Car ils n'ont pas de but, ils ne savent pas quoi en tirer. De plus la plupart du temps ils n'ont pas les bonnes resources. Il faut être capable d'aller en production.

Le MLOps est fait pour monitor et passer en prod.
**ML == CODE + DATA**

- automatiser la quality check
3 grosses étapes sur les pipelines automatisées :
- data pipelines : entraîner avec un dataset mis à jour (automatisé)
- modelling pipeline : gestion de métadonnées, automatisations
- release pipeline : automatisation des builds, tests et déploiements des pipelines
**Observabilité** -> La surveillance fournit aux équipes logicielles des instruments pour recueillir des données sur leurs systèmes et leur permettre de réagir rapidement en cas d’erreurs et de problèmes

5 Grosses étapes pour automatiser la data :
- Ingestion : ingestion automatique de la data provenant de sources variées
- Quallity checks : Vérification automatique de la data pour eviter les erreurs et les warnings
- Storage : Archiver et versionner la data
- Processing : Transformation des données brutes en paramètres à utiliser pour le modelling
- Feature store : simple accès aux paramètres pour l'entraînement / les prédictions
4 composants pour une automatisation réussie des modelling pipelines :
- Experimentation tracking (s'améliore beaucoup) : historique des analyses, du tuning et des paramètres
- Metadata store : capture de la metadata pour connecter l'entraînement, les modèles, l'usage et la performance
- Quality checks : automatisation des quality checks pour la production (ok or not)
- Pipelines triggers : automatisation -> retient le meilleur modèle pour la mise en prod
- Models registery : modèle central permettant la réutilisations et le versionning
Les 2 grosses façons de déployer en machine learning sur leur système :

Le realtime c'est bien.
**Quelle version est actuellement en prod ?**
Cette question si posée aux ML est une catastrophe. Ils ne sont pas capables de répondre -> il faut les aider (DevOps, release notes)

Il faut les bons réflexes de comment industrialiser la solution.
## Jobs / Offres de Stages
Pour rejoindre BCG Gamma France, [c'est par ici](https://www.bcg.com/fr-fr/beyond-consulting/bcg-gamma/careers).
Vous pouvez contacter l'intervenant sur [LinkedIn](https://www.linkedin.com/in/nielsfreier/?originalSubdomain=fr).