+33 (0)1 53 89 99 93 info@xebia-training.fr

Data Science

Formation Data Science en Production

Avec Sandra Pietrowska et Fares Oueslati

La Data Science est une discipline qui ne cesse d’intriguer et d’attiser la convoitise, les projets de type POC (Proof Of Concept : la démonstration de faisabilité) se multiplient et les technologies autour sont de plus en plus abondantes, avec parfois peu de maturité. C’est pourquoi ce genre de projet fait souvent face à de grandes difficultés lorsqu’il s’agit de l’industrialiser.

La mise en production est une phase primordiale de chaque projet Data Science ayant pour ambition d’aller au-delà du POC. Le chemin pour y arriver n’est pas toujours simple, et nécessite d’identifier certains besoins et challenges dès le démarrage, que l’on adresse lors de cette formation.

Chez Xebia, depuis plusieurs années nos Data Scientists et Data Engineers travaillent sur les projets de bout en bout, de la phase exploratoire jusqu’à l’industrialisation. Cette formation a pour but de vous aider à franchir cette étape fatidique qu’est la mise en production dans les conditions les plus favorables. C’est dans ce contexte qu’est née la formation Data Science en production !

Programme

Introduction, problématiques et enjeux du processus de mise en production

Nous débuterons par une discussion autour des principales difficultés et des besoins inhérents à la mise en production.

Ces premiers éléments nous permettrons de décliner les notions illustrées tout au long de la formation.

Choix des outils, configuration des environnements et bonnes pratiques de développement

La préparation de l’environnement de travail est une étape cruciale du développement d’un produit. La  connaissance des contraintes de la production et le choix des bons outils vont vous permettre d’avancer plus vite et éviter des mauvaises surprises lors de la mise en production.  Dans cette partie nous allons répondre aux questions suivantes :

  • Quels sont les outils d’exploration les plus adaptés ?
  • Comment les utiliser de manière efficace ?
  • Comment configurer mon environnement de travail ?

Pour un développeur seul ou travaillant en équipe, il est nécessaire de respecter les bonnes pratiques de développement et du Software Craftsmanship. Le code mis en production doit être compréhensible, optimisé et testé. Nous allons nous focaliser sur :

  • Les tests unitaires et d’intégration
  • La gestion de workflow
  • Le craftsmanship
Industrialisation d’un projet et monitoring

Chaque évolution du produit implique l’industrialisation du code. Dans cette section nous allons couvrir les sujets suivants :

  • Les outils de packaging
  • La gestion des releases
  • Intégration continue
  • Déploiement continu

Les résultats du modèle, le temps d’entraînement et de prédictions doivent être monitorés et analysés régulièrement. Nous vous proposons :

  • Les outils de visualisation adaptés
  • Les métriques
  • La gestion des réapprentissage
  • L’analyse d’interprétabilité du modèle

Objectif

A l’issue de cette formation, les participants sauront :

  • Identifier les étapes primordiales au processus d’industrialisation de projets Data Science
  • Se projeter en termes d’outillage logiciel et d’infrastructure
  • Développer une intuition autour du Craftsmanship et des bonnes pratiques de développement
  • Sensibiliser vis à vis des contraintes à prendre en considération lors de l’industrialisation
  • Connaître et manipuler les outils open source qui permettent la mise en production
  • Savoir mieux gérer les rôles et la communication de l’équipe

Méthodes pédagogiques

⅓  de pratique et ⅔  de théorie.

Au travers de discussions dirigées par le formateur et d’exercices “Hands-On” interactifs, les participants apprendront à faire une mise en production d’un modèle de Machine Learning.

Tarif HT

Inter : 1 800 €

Intra : Selon demande

Prochaines dates de formation

5 – 6 novembre

Biographie


Sandra Pietrowska

Sandra dispose de connaissances théoriques et pratiques dans la modélisation statistique, le développement et l’application des algorithmes machine learning avec une forte compréhension des enjeux business. Elle intervient sur l’ensemble des étapes d’un projet data science, jusqu’à la mise en production. Chez ses clients elle travaille en collaboration avec les data engineers pour mettre en place des bonnes pratiques du développement ainsi que des outils nécessaires pour assurer l’industrialisation efficace dès la première version du modèle.
Elle est diplômée de l’Université Polytechnique de Catalogne et de l’Université de Lyon 2 en Data mining et gestion de connaissances ainsi que de la Haute Ecole de Commerce de Varsovie en Méthodes Quantitatives en Économie et Systèmes d’Information.
Sandra a été un speaker aux conférences Breizhcamp 2017 (“Luigi : le Machine Learning lui dit merci” et à la Xebicon 2017 (“Deep Learning dans la vraie vie”).

    Biographie

    Fares Oueslati

    Titulaire d’un diplôme d’ingénieur en génie logiciel, Fares est un Data Engineer avec une forte appétence pour la Data Science.

    Chez ses clients, il met en place des applications distribuées et dédiées au traitement de flux de données sous une contrainte proche du temps réel, il travaille également sur la mise en place et l’industrialisation de pipelines de machine learning.

    Toujours désireux d’apprendre et heureux d’enseigner ce qu’il sait.

    Public visé

    Cette formation Data science en production est parfaitement adaptée aux analystes de données, Data Scientists ou développeurs ayant une appétence pour le Machine Learning.

    Prérequis

    Une connaissance de Python ou Scala est préférable.
    Une connaissance préalable de Java et Spark n’est pas requise.
    Les postes de travail et les logiciels nécessaires au bon déroulement de la formation sont fournis par Xebia. 

    Validation

    À la fin de cette formation, les stagiaires recevront une attestation de présence.

    SOFTWARE TRAINING DONE RIGHT