Data Science & Engineering
Lead

Formation Data Engineering

Ajoutez une compétence cruciale à votre CV en vous formant au Data Engineering. En 150h de formation, maîtrisez les bases du métier de Data Engineer et validez vos compétences avec notre certification reconnue par l'État.

Prochaines formations :
Prendre RDV
Télécharger le syllabus
Course Report - Best Data Science Bootcamp 2024
Switchup - Best Bootcamps 2023
Construisez votre futur dans la data
Programme

Devenez un expert du Data Engineering

Vous travaillez déjà dans la Data ? Développez une double-compétence très demandée ! En 2024, les entreprises recherchent des profils hybrides entre Data Scientist et Data Engineer. En 150h, obtenez des bases solides en Data Engineering et Deep Learning.

À la fin de votre formation Data Science Lead chez Jedha, vous serez en mesure de :

  • Déployer de manière robuste vos applications avec Docker et Kubernetes
  • Construire un pipeline Data pour analyser les données générées par vos applications
  • Automatiser et monitorer vos modèles de Machine Learning
Télécharger le programme
Construisez votre futur dans la data

Créez votre parcours de formation sur-mesure

Nos formations en Data sont conçues par niveau et peuvent se combiner. Si vous n'avez pas déjà un niveau avancé en Data Science, vous pouvez suivre notre formation Data pour débutant ou notre formation pour devenir Data Scientist.
Et pour aller plus loin et devenir un pro du Cloud, vous pouvez ajouter à votre parcours notre formation AWS et profiter de tarifs avantageux.

Le programme de notre formation Data Engineer

Data Governance

Ce module vous permettra de comprendre les enjeux liés au data management et d’accompagner les entreprises dans la mise en place d’une gouvernance des données efficace.

Vous apprendrez à évaluer la maturité d’une entreprise en matière de gestion des données, à structurer ses équipes data en fonction des besoins et à assurer la conformité aux réglementations en vigueur (RGPD, AI Act, etc.).

Module 1

Data Governance

Compétences maîtrisées
  • Conception et mise en place d’une politique de Data Gouvernance.
  • Évaluation des risques à l’aide d’audits de data management.
  • Structuration et évolution des équipes data en fonction des enjeux métiers et business.
  • Mise en conformité des pratiques avec les réglementations en vigueur.
Déploiement & ML Distribué

Dans ce deuxième module, vous découvrirez comment déployer votre application d’IA sur n’importe quel serveur grâce à Docker. La maîtrise de Kubernetes vous permettra de vous assurer qu’elle fonctionne bien à l’échelle.

Vous apprendrez également à booster vos modèles grâce à Ray, un Framework de ML distribué. Cela vous permettra de travailler sur des modèles de Machine Learning et Deep Learning plus complexes.

Module 2

Déploiement & Distributed ML

Compétences maîtrisées
  • Déploiement d'applications à l'aide de Docker et Kubernetes.
  • Distributed Machine Learning & Deep Learning avec le framework Ray.
Architecture des bases de données

Dans ce module, vous apprendrez à concevoir et déployer différentes architectures de bases de données en fonction des besoins métiers. Vous découvrirez les bases de données transactionnelles (OLTP), analytiques (OLAP) et NoSQL, ainsi que leurs cas d’usage respectifs.

À l’issue de ce module, vous serez ainsi capable de structurer efficacement les données pour optimiser leur stockage, leur accès et leur analyse.

Module 3

Architecture des BDD

Compétences maîtrisées
  • Déploiement d’infrastructures OLTP à l'aide de Postgres.
  • Déploiement d’infrastructures OLAP à l’aide d’une data warehouse comme Snowflake.
  • Déploiement d’infrastructures NoSQL à l’aide d’un logiciel de gestion de base de données NoSQL comme MongoDB.
Data Pipelines

Une fois votre application en production, elle génère une grande quantité de données qu'il faut collecter, transformer et acheminer efficacement.

Dans ce module, vous apprendrez à concevoir et mettre en place des pipelines de données robustes, en comprenant les différences entre les architectures ETL et ELT, ainsi que leurs cas d’usage. Vous appliquerez ces concepts en pratique sur Airbyte.

Module 4

Data Pipelines

Compétences maîtrisées
  • Compréhension des pipelines de données : différences entre ETL (Extract, Transform, Load) et ELT (Extract, Load, Transform), cas d’usage et bonnes pratiques.
  • Mise en place de processus ELT : extraction, chargement et transformation des données avec Airbyte sur Kubernetes.
Automation & Workflow

Vous découvrirez la puissance des automatisations pour gagner en efficacité ! Vous apprendrez à créer des automatisations entre applications à l’aide d’outils comme Airflow, et découvrirez les bonnes pratiques. Vous apprendrez également comment utiliser Airflow pour automatiser votre pipeline Data.

Module 5

Automation & Workflow

Compétences maîtrisées
  • Automatisations entre applications : bonnes pratiques & création de workflows avec Airflow.
  • Automatisation de votre pipeline Data : utilisation d’Airflow.
Reinforcement Learning

Dans ce module, vous découvrirez le Reinforcement Learning, une branche avancée de l’IA qui permet à un agent d’apprendre par essais et erreurs pour maximiser une récompense. Utilisé pour l’amélioration des modèles de langage (LLM) tels que ChatGPT, le Reinforcement Learning est à l’origine d’avancées majeures ces dernières années.

Vous apprendrez également à créer votre propre environnement de développement et à améliorer la puissance et vitesse de calcul de vos modèles.

Module 6

Reinforcement Learning

Compétences maîtrisées
  • Utilisation des bibliothèques PyTorch et trl pour entraîner des modèles de Reinforcement Learning.
  • Déploiement et gestion d’environnements de calcul avancés avec Docker et Kubernetes.
  • Création et personnalisation d’environnements avec OpenAI Gym.
MLOps

Dans ce module, vous apprendrez à industrialiser vos modèles de Machine Learning en automatisant chaque étape : le testing, l’intégration et le déploiement continus (CI/CD), l’entraînement automatisé (Continuous Training) et le monitoring.

Vous adopterez les meilleures pratiques de MLOps pour garantir des modèles performants, fiables et faciles à maintenir en production.

Module 7

MLOps

Compétences maîtrisées
  • Écriture et exécution de tests automatisés avec pytest.
  • Mise en place de pipelines CI/CD avec Jenkins.
  • Continuous Training avec Jenkins et Mlflow.
  • Monitoring des performances des modèles avec Evidently AI.
Projet final

Lors de ce projet final, vous mettrez à profit l’ensemble des connaissances acquises au cours du module MLOps et des modules précédents afin de construire une pipeline de données incluant une pipeline d’IA entièrement automatisée.

Module 8

Projet final

Compétences maîtrisées
  • Créer une data pipeline automatisée.
  • Développer une ML pipeline automatisée.
Voir le programme détaillé
Certifications

Obtenez un diplôme Bac+5

À l'issue de votre formation de Data Engineer, vous serez en mesure d'obtenir 2 types de certifications pour faire valoir vos compétences sur le marché du travail :

  • Votre attestation de réussite (c'est votre diplôme !)

Grâce à la validation de ce certification professionnelle, notre formation est éligible au CPF et à la plupart des financements publics.

En savoir plus

Décrochez le poste de vos rêves dans la Data

+9 500 €
Augmentation de salaire médiane après une formation Fullstack
97%
de nos alumni se sentent mieux dans leur nouvelle carrière
93,5%
de nos alumni en Data Science sont en emploi 2 ans après leur formation
Couverture rapport d'insertion professionnelle Jedha 2024

Rapport d’insertion Jedha 2024

Découvrez le parcours de nos alumni avant et après leur formation chez Jedha : profil des apprenants, insertion professionnelle, salaire médian et postes occupés.

Télécharger

Statistiques calculées en avril 2024 sur l’ensemble de nos formations à partir de notre enquête d’insertion annuelle et des profils LinkedIn de nos alumni.

Téléchargez le syllabus de nos formations

Excellence académique et technique

Apprentissage par la pratique

Formations adaptées à vos contraintes pros et persos

4,9
/5
Meilleure formation en France
Découvrez le programme détaillé
Nous avons bien reçu votre demande !
Le syllabus de nos formations vous parviendra par e-mail d'ici quelques minutes.
Oops! Something went wrong while submitting the form.
Sessions

Nos prochaines sessions de formation

Suivez votre formation à distance ou dans l'un de nos 17 campus à Paris, Lyon, Lille, Marseille, Bordeaux, Toulouse, Nantes et dans bien d'autres villes de France et d'Europe.

Temps partiel
14
Apr
2025
22
Jun
2025
Coaching individuel à la demande
1 cours en direct par module
Dernières places !
S'inscrire
Temps plein
22
Apr
2025
23
May
2025
Du lundi au vendredi
9h30 - 18h
Dernières places !
S'inscrire
Temps plein
16
Jun
2025
11
Jul
2025
Du lundi au vendredi
9h30 - 18h
Dernières places !
S'inscrire
Temps partiel
16
Jun
2025
24
Aug
2025
Coaching individuel à la demande
1 cours en direct par module
Dernières places !
S'inscrire
Temps plein
18
Aug
2025
12
Sep
2025
Du lundi au vendredi
9h30 - 18h
Dernières places !
S'inscrire
Temps partiel
18
Aug
2025
26
Oct
2025
Coaching individuel à la demande
1 cours en direct par module
Dernières places !
S'inscrire
Oups ! Aucune session dans ce format n'est prévue pour le moment, contactez-nous pour en savoir plus

Vous ne savez pas quel format choisir ?

Découvrez nos modalités d’apprentissage en détail dans notre article dédié.

Avis de nos étudiants

Choisissez l’excellence pour vous former en data engineering

4.9/5
Logo googleLogo course reportLogo Switchup
Switchup Best Bootcamps Jedha 2023Course Report Best Data Science Bootcamp 2023 JedhaCourse Report Best Cyber Security Bootcamp 2024 Jedha

Reconversion réussie de Responsable Qualité à RSSI @ House of Aby

A suivi la formation Cybersécurité Fullstack

Le programme est très complet et couvre tous les aspects essentiels de la cybersécurité

J'ai choisi Jedha pour me reconvertir dans la cybersécurité et j'en suis très satisfait ! La formation est certes intense mais l'étendue des sujets abordés, ainsi que la qualité des cours, des professeurs et des TA en valent largement la peine. Le programme est très complet et couvre tous les aspects essentiels de la cybersécurité : pentesting, monitoring, cryptographie, systèmes et réseaux. Chaque module est conçu pour être à la fois théorique et pratique, ce qui permet d'acquérir des compétences directement applicables sur le terrain. L'ambiance est conviviale, ce qui favorise une dynamique de groupe stimulante et propice à l'apprentissage !

Voir plus

Reconversion réussie de Data Analyst à Data Engineer en freelance

A suivi la formation Data Science Lead

J'ai pu passer du métier de Data Analyst à celui de Data Engineer

Formation excellente donc le contenu est très bien structurée et permet de réellement progresser d'un point de vue compétences opérationnelles. L'équipe pédagogique est très compétente et investie dans le transmission des compétences. Je recommande donc fortement cette formation et Jedha qui m'ont permis de passer du métier de Data Analyst à celui de Data Engineer.

Voir plus

Reconversion réussie de Responsable fonctionnel à Data & AI Product Owner @ BNP Paribas

A suivi les formations Data Science Fullstack & Lead

L'ambiance est super, avec beaucoup d'échanges et d'entraide

Je recommande vivement : c'est du sérieux, très intensif (prévoyez de bien manger et dormir !) mais l'ambiance est super, avec beaucoup d'échanges et d'entraide. Le programme est riche et complet et la pratique complète systématiquement la théorie. La plateforme JULIE est excellente, je m'en sers toujours pour revoir des concepts ou retrouver des templates de code ! Les enseignants sont des professionnels passionnés, très pédagoques et disponibles.

Voir plus
Voir tous les avis
Déroulement

Comment postuler à notre formation en Data Engineering ?

Rien de plus simple ! Prenez rendez-vous avec notre équipe pour affiner votre projet professionnel. Selon le parcours choisi et les financements nécessaires, votre inscription prendra entre 1 semaine et 1 mois.

1

Coaching carrière

Discutez de votre projet professionnel avec notre équipe d’admissions. Nous vous recommanderons la formation et le format de cours le plus adapté.

2

Test de positionnement

Répondez à un rapide QCM afin d’évaluer votre niveau en programmation et en mathématiques.

3

Financements

Concrétisez votre projet avec l’aide de notre équipe.
Recherche de financements, constitution du dossier : nous vous accompagnons de A à Z.

Pré-requis

  • Il est nécessaire d'avoir au moins 2 ans d'expérience en Data Science. Si ce n’est pas le cas, vous pouvez suivre notre formation en Data science.
  • Il est également nécessaire d'être à l'aise pour lire et comprendre des contenus en anglais (niveau B1/B2) : nos cours sont dispensés en français mais les ressources pédagogiques (cours écrits, exercices, projets) sont en anglais.

Formez-vous au Data Engineering à votre rythme

Montez en compétences facilement en Data Science & Data Engineering. Formation en ligne ou Bootcamp : nous avons forcément une formation qui correspond à votre projet de reconversion !

Temps complet (1 mois)

  • 150h d'apprentissage en classe
  • Lundi à vendredi, 9h30 - 18h
  • À temps complet sur 1 mois

En ligne ou sur l'un de nos 17 campus

  • Formation accélérée
  • Esprit de promo
  • Discipline de travail
En savoir plus

Temps partiel (3 mois)

  • 150h d'apprentissage hybride (travail en autonomie, cours, coaching)
  • À votre rythme (2h par jour)
  • À temps partiel sur 3 mois

En ligne

  • Adapté à vos contraintes pros et persos
  • Apprentissage en autonomie
  • Accessible partout dans le monde
En savoir plus
Financement

Frais de formation

Formation seule
4 000 €
Inclus dans nos tarifs
  • Suivi par nos professeurs
  • Accès à vie aux cours sur JULIE
  • Attestation de réussite
  • Coaching carrière
  • Communauté Jedha sur Discord
  • Accès à vie à nos évènements
Combinez cette formation avec nos autres programmes pour profiter d’une réduction
Data Science Lead
---
5 500 €
5 000 €
5 500 €
5 000 €
11 500 €
10 500 €

Comment financer votre formation pour devenir Data Engineer ?

  • Compte Personnel de Formation (CPF)

Notre formation Data Engineer est éligible au Compte Personnel de Formation (CPF). Utilisez tout ou partie de votre solde CPF pour la payer.

  • Paiement en 3 fois sans frais

Étalez le paiement de votre formation en 3 mensualités, et cela sans aucun frais grâce à notre partenaire Stripe !

  • Prêt étudiant à taux avantageux

Profitez d’un prêt étudiant à taux préférentiel avec la Société Générale. Il n’y a pas de limite d’âge, et vous commencez à rembourser une fois la formation terminée.

  • Votre employeur ou votre OPCO

Si vous êtes en poste, votre employeur peut financer votre formation, directement ou via son OPCO. Nos équipes vous aideront à constituer un dossier.

Enfin, notre formation est également éligible à de nombreux financements publics dont l’AIF de France Travail, Transitions Pro et d’autres financements régionaux.

Comment financer votre formation pour devenir Data Engineer ?
Postuler à la formation
Télécharger le syllabus

Les débouchés de notre formation en Data Engineering

Notre formation en Data Engineering vous permettra d'atteindre un niveau d'expertise plus élévé et d'accéder à des métiers plus techniques dans le domaine : Data Engineer, Machine Learning Engineer, ML Ops. C'est la suite parfaite à donner à votre carrière de Data Scientist, ou si vous venez de suivre une formation pour devenir Data Scientist.

Data Engineer

C'est un métier hautement technique ! Le Data Engineer est chargé de concevoir, construire et gérer les infrastructures Data. C'est lui qui permet au travail des Data Scientist d'avoir une application concrète en mettant leurs modèles en production.

La Data Sciences et le Data Engineering enseignés par des professionnels

Les maîtres Jedha, ce sont eux ! Nos intervenants et nos créateurs de contenu sont des professionnels en activité dans le domaine de la Data. Eux-mêmes Lead Data Scientist ou Data Engineer, ils disposent d'une véritable expertise technique en Data Engineering qu'ils vous transmettent lors de la formation.

Charles Tanguy
Charles Tanguy
Lead Instructor
 @
Jedha
Notre supra Maître Jedha ! Charles est notre Lead Instructor, ayant enseigné chez Jedha depuis les premières sessions. Double diplômé de l'ENSAE & HEC, Charles est aussi la garant de l'excellence des contenus de cours de Jedha.
[...]
Lire plus
Charles Tanguy
Diplômé en statistiques de l'ENSAE et d'HEC Paris, Charles est notre Lead Instructor. Il a d'abord travaillé en tant que Data Scientist chez PayWithMyBank à San Fransisco puis chez MWM. Depuis 2018, il enseigne la Data Science et le Data Engineering chez Jedha et a participé à l'élaboration de la plupart de nos formations en data.
Lire moins
Guillaume Manderscheid
Guillaume Manderscheid
Data Scientist / Data Engineer Freelance
 @
Au delà d'être un fin vulgarisateur, Guillaume est marqué par sa passion de la Tech. Ayant d'abord travaillé pour d'importantes structures dans l'énergie (notamment chez ENGIE), il s'envole pour San Fransisco où il travaille en tant que Data Scientist / Data Engineer.
[...]
Lire plus
Guillaume Manderscheid
A San Fransisco, il travaille non seulement sur de la modélisation, mais aussi sur du déploiement. C'est à ce moment qu'il opère un shift vers le Data Engineering en rejoignant Strateos en tant que Data Engineer. En revenant à Paris, il se redécouvre une passion pour l'enseignement et délivre les cours sur chacun de nos 3 programmes en Data.
Lire moins
Laurent Morelli
Laurent Morelli
Co-founder
 @
Timelight
Laurent est aussi bon manager qu’il n’est bon technicien ! Enseignant autant sur la partie Data Science que sur le Data Engineering, Laurent vous donnera de précieux conseils sur la direction à prendre dans vos projets, le tout dans le but de vous faire gagner en autonomie.
[...]
Lire plus
Laurent Morelli
Laurent est aussi bon manager qu’il n’est bon technicien. Il travaille pendant plus de 3 ans chez Matters Startup Studio, entreprise développant des applis web. En tant que Head of AI, il y développe tout le département Data sur diverses problématiques. Suite à quoi il crée 2 entreprises. Une première, Paprika, aidant les startups grâce aux méthodes de Machine Learning puis une seconde, Timelight en Mars 2019. Timelight est un outil aidant les entreprises dans leur analyse des données temporelles : de précieux conseils à demander à Laurent !
Lire moins
Télécharger le syllabus
FAQ

Vos questions sur la formation

Dois-je venir avec mon propre ordinateur ?

Quelle différence entre un Data Engineer et un Data Scientist ?

Comment devenir Data Engineer ?

Quel est le salaire d'un Data Engineer ?

Comment se déroule la journée type d'un Data Engineer ?

Quelles compétences sont cruciales pour un Data Engineer ?

Quelle est le rôle d'un Data Engineer ?

En quelle langue sont dispensés les cours chez Jedha ?

Combien coûte la participation à votre formation en Data Engineering ?

Quels sont les pré-requis pour rejoindre la formation Lead ?

Une question ? Posez-là à notre équipe d’Admissions !

Postuler à la formation

Téléchargez le syllabus de nos formations

Excellence académique et technique

Apprentissage par la pratique

Formations adaptées à vos contraintes pros et persos

4,9
/5
Meilleure formation en France
Découvrez le programme détaillé
Nous avons bien reçu votre demande !
Le syllabus de nos formations vous parviendra par e-mail d'ici quelques minutes.
Oops! Something went wrong while submitting the form.