La formation 100% en ligne pour vous mettre dans la peau d'un Data Engineer et vous former sur un vrai projet d'entreprise.

par Blent.ai


Une formation opérationnelle pour maîtriser toutes les compétences Data Engineering sur un projet d'entreprise, du calcul parallèle à l'automatisation en passant par le processing temps réel.

Un programme complet autour de 5 piliers :

  • Le bootcamp de préparation
  • La stockage de données volumineuses
  • Le calcul parallèle avec Spark
  • Le flots de données en temps réel
  • L'automatisation et déploiement de modèles


📅  150 heures de e-learning (+ 8 séances de coaching individuelles à la demande)

📚  e-learning (+ coaching en option)

💶 1 800€ (sans coaching) ou 4 200€ (avec coaching). Payable en 3x sans frais.


Pour en savoir + sur le programme ou échanger avec l'organisme de formation c'est par ici 

⬇️



Utilisez votre CPF pour financer cette formation

Si vous n'avez plus de crédits CPF, il existe d'autres modes de financement. Contactez-nous si vous avez besoin d'aide.



Vous pouvez également nous contacter au 06 30 90 99 06.

Pour qui est fait ce programme

  • Data Scientist / Consultant / Développeur / Manager Data / Product Owner

    Vous voulez booster votre carrière en vous formant sur le métier le plus demandé de la Data et/ou souhaitez avoir un management pertinent.

  • Chercheur / Étudiant / Jeune diplômé

    Vous souhaitez apprendre les meilleures techniques de Data Engineering par la pratique et vous familiariser avec les vrais besoins des entreprises.

  • Entrepreneur / CTO / CEO

    Startuper ou porteur de projet, vous avez la volonté d’utiliser le Big Data pour accélérer ton business.

Avec ce programme vous pourrez :

  • Écrire des programmes Python robustes pour les systèmes en production.

  • Utiliser les principaux outils opérationnels tels que Visual Studio Code, Bash ou encore Git.

  • Utiliser des bases de données NoSQL pour héberger des données volumineuses.

  • Construire des pipelines ETL en prenant en compte les aspects de chaque base de données source et cible.

  • Configurer un cluster Hadoop et y exécuter Spark dessus.

  • Développer des pipelines ETL et des scripts Spark.

  • Savoir dans quelles situations utiliser et installer Kafka.

  • Construire des applications robustes et efficients pour le calcul temps réel.

  • Être capable de développer des programmes d'analyses et de traitement en temps réel avec ksqlDB et Spark Streaming.

  • Créer des pipelines ETL automatisés, robustes et scalables et déployer des modèles de Machine Learning avec des API REST et des conteneurs.

L'organisme de formation

Blent.ai

Blent.ai est une plateforme 100% en ligne pour se former aux métiers de Data Scientist, Data Engineer et Machine Learning Engineer.

Après plusieurs années d'expérience sur des projets Data au sein de startups et grands groupes français et internationaux, les fondateurs se sont donnés pour mission de proposer des formations concrètes pour répondre à des enjeux opérationnels.

Leurs formations sont des immersions en situation réelles à partir de cas d'étude tirés de problématiques auxquelles sont confrontées de grandes entreprises de la Tech.

La communauté Blent.ai compte plusieurs centaines d'alumni, de mentors et d'entreprises.

Les Mentors / Instructeurs

Taeib Badis

CEO et co-fondateur de Blent.ai

Mathématicien de formation, Taieb a 10 années d'expérience en Data.

Il a réalisé de nombreuses missions en France et à l'International auprès de grands groupes sur différents sujets autour de la Data (Machine Learning, Big Data, Data Management, RGPD).

Maxime Jumelle

CTO et co-fondateur de Blent.ai

Actuaire de formation, Maxime a réalisé plusieurs projets sur des données très volumineuses, aussi bien pour l'ingestion de données que la mise en place d'algorithmes de Machine Learning.

Ses nombreuses expériences dans la mise en place et la maintenance de systèmes de stockage de fichiers et de bases de données ainsi que l'implémentation de systèmes de gestion de données en temps réel lui permettent d'avoir une vision claire sur l'état de l'art des projets Data.

Samy Kerboua-Benlarbi

Machine Learning Engineer

Il a participé à plusieurs projets Data Science dont le développement de systèmes d'apprentissage supervisé pour la conduite autonome.

Ces projets sont centrés sur divers sujets liés à l'apprentissage automatique et à l'apprentissage profond, y compris la vision par ordinateur et la génération de données, les représentations multiples et le clustering flou.

Christophe Blefari

Data Engineering Lead

Parmi ses réalisations : la mise en place de la plateforme de données et de l’équipe data engineering chez Kapten et un travail sur un large éventail d’architectures possibles (cluster Hadoop dans le cloud et on-premise, datawarehouse GCP ou AWS..).

Christophe est également à temps partiel Data Engineering Lead chez Qonto qu'il accompagne sur le plan technique et humain.

Curriculum du programme

1. Bootcamp de préparation

Lorsque vous serez officiellement inscrit, Blent.ai vous donnera accès à 30h de cours pour que vous puissiez apprendre les bases en Python, les commandes systèmes Bash et la manipulation de données. Cette phase de préparation est disponible dès votre inscription à la formation, et vous pourrez poser toutes vos questions à leur équipe de professeurs sur Slack.

Ce que vous allez apprendre dans cette phase :

  • Maîtriser le langage Python et son utilisation avancée pour les systèmes en production.
  • Utiliser les commandes Bash et les principaux éléments utilisés dans les environnements UNIX.
  • Utiliser Visual Studio Code en tant qu'environnement de développement intégré.
  • Les bases du Cloud Computing et les concepts essentiels de virtualisation.


2. Stockage de données volumineuses

Lors de cette première phase, vous aborderez le stockage des données, et notamment les différentes solutions qui existent. Vous étudierez ces solutions, tant sur le plan économique que technique, sur comment vous allez stocker des centaines de Go de données.

En plus des bases structurées classiques de la famille SQL ou du stockage persistent, vous découvrirez les bases de données orientées documents (MongoDB), les bases de données orientées colonnes distribuées (avec Cassandra et BigQuery) ainsi que les bases de données clé/valeur en mémoire dont Redis est le plus populaire. Enfin, une petite ouverture sur les bases NewSQL sera proposée pour être prêt face aux futures systèmes de gestion de bases de données.

Ce que vous allez apprendre dans cette phase :

  • Identifier les situations où utiliser un Data Lake et/ou un Data Warehouse.
  • Utiliser des bases NoSQL en tant que sources et cibles pour des pipelines ETL.
  • Mettre en place une gouvernance et des schémas de données.


3. Calcul parallèle avec Spark

Une fois le stockage correctement établi, une des premières choses sur lequel le Data Engineer doit réfléchir est la bonne construction d'un processus ETL (pour Extract Transform Load) afin d'automatiser le processing de la donnée jusqu'à un Data Warehouse.

Du fait de la grande quantité de donnée à disposition, les outils de calcul parallèle, dont Hadoop et Spark sont les plus populaires, vous permettront d'effectuer un nombre impressionnant de calculs en un temps très court grâce aux clusters à disposition dans le Cloud. En complément des processus ETL, les applications dites serverless permettent aujourd'hui de lancer des calculs spécifiques sans se soucier de l'infrastructure cible.

Ce que vous allez apprendre dans cette phase :

  • Utiliser l'approche fonctionnelle de Spark et construire des algorithmes MapReduce.
  • Manipuler des DataFrames de très grande taille avec Spark SQL en prenant en compte le caractère distribué.
  • Lancer et administrer un cluster Hadoop.


4. Flots de données en temps réel

Aujourd'hui, beaucoup d'applications alimentent les bases avec des données en temps réel (ou à flot continu) : c’est le Data Streaming. Comment peut-on appliquer un processus ETL efficace ?

Pendant cette phase intermédiaire, vous mettrez en place plusieurs solutions pour le Data Streaming, avec notamment des architectures publish-subscribe avec Apache Kafka. Vous verrez également Confluent Platform, qui apporte de nouvelle fonctionnalités puissantes à Kafka. Vous verrez ensuite comment traiter et analyser ces données en temps réel aussi bien dans un paradigme SQL avec ksqlDB qu'avec l'architecture MapReduce ou les DataFrames de Spark Streaming.

Ce que vous allez apprendre dans cette phase :

  • Installer un cluster Kafka sur une ou plusieurs machines.
  • Construire des applications asynchrones pour produire des données ou consommer des données depuis Kafka.
  • Utiliser des schémas de données pour la sérialisation et les connecteurs pour la migration de données.
  • Créer des applications de processing temps réel avec ksqlDB et Spark Streaming.


5. Automatisation et déploiement de modèles

Cette dernière étape est la plus importante : c'est elle qui définit comment les applications vont être intégrés dans une infrastructure Cloud.

Véritable institution dans le Cloud Computing, vous verrez la puissance de la conteneurisation d'applications avec Docker, et comment les solutions sur le Cloud permettent de répartir les charges de travail. De plus, les outils d’automatisation sont indispensables pour le Data Engineer : vous utiliserez Airflow, une référence en la matière.

Ce que vous allez apprendre dans cette phase :

  • Installer Airflow sur un serveur et construire des DAGs en Python.
  • Conteneuriser des applications et des API pour des modèles de Machine Learning.


Qu'en pensent les alumni ?

Ismaila D.

Consultant Data Scientist @Velvet Consulting

Le parcours Data Enginer m'a été très bénéfique. C'est une formation complète axée sur la pratique ce qui permet une rapide montée en compétences sur le sujet. En effet, elle m'a permis de sortir de ma zone de confort de Data Scientist recevant des données presque propre. Il faut enfin souligner l'approche pédagogique qui a été mise en place. Elle combine des exercices et un projet global, le tout dans un environnement collaboratif qui permet d'interagir entre élèves d'une et d'autre part avec le formateur.

Idrissa S.

Data Analyst @PSA Banque

Parcours Data Engineer de haute qualité orienté pratique avec un projet comme si on était en entreprise. Les Mentors sont très compétents et pédagogues. Ils nous transmettent leur connaissances techniques mais surtout leurs retours d’expérience du secteur de la Data. Je recommande vivement.

Mehdi D.

Machine Learning Engineer @Soladis

J'ai réalisé les parcours Data Scientist et Data Engineer. Ces parcours sont très riches et m'ont permis de monter en puissance en Data. On s'est formé sur des projets réels d'entreprises. Grâce à des Mentors passionnés, très expérimentés et toujours disponibles, je suis aujourd'hui en mesure de travailler sur des projets de Machine Learning, Deep Learning, Big Data et Cloud.

Bangaly C.

Data Scientist @La Banque Postale

Le parcours Data Engineer de Blent est très complet. Il permet de comprendre toutes les composantes du métier à savoir : l'implémentation de Data Lake et Data Warehouse, la collecte et le traitement de données, l'utilisation des bases NoSQL, le traitement de flux continu de données avec Kafka et le déploiement d'algorithmes de Machine Learning. La formation m'a également permis de monter en compétence sur Google Cloud et sur la programmation Bash. J'ai particulièrement apprécié l'approche pédagogique et la disponibilité des formateurs.

Format en e-learning interactif avec coaching en option

Un apprentissage à votre rythme avec le soutien des mentors et des pairs

Une formule de base :

> 150 heures de e-learning accessible à vie
> Accès à une plateforme de code en ligne
> Accès à un espace sur la plateforme pour poser vos questions écrites quand vous le souhaitez
> Workshops Live mensuels pour poser vos questions directement aux Mentor
> Un certificat Data Engineer reconnu par le marché
> Mise en relation avec les meilleures entreprises Tech du marché

En option un "coaching sur-mesure" :

> 8 séances de coaching individuelles à la demande avec des Mentors expérimentés
> Accompagnement pour appliquer directement sur vos propres données

Une communauté Slack dynamique :

La Blent Family regroupe des Data Scientists, Data Engineers, ML Engineers, mais aussi des entrepreneurs, chercheurs ou UX Designers... On y voit des projets naître, des équipes s'allier pour réaliser des compétitions Kaggle ou encore des recrutements réalisés.

FAQ

  • Quels sont les pré-requis pour intégrer une telle formation ?

    Même si Blent.ai offre une mise à niveau avant le début de la formation pour avoir les bases en Python et en manipulation des données, il faut tout de même avoir de bonnes notions en programmation.
    Une expérience en Java ou en Python serait un vrai plus, même si la maîtrise de ces deux langages n'est pas indispensable pour suivre la formation : une bonne connaissance de SQL sera suffisante.

  • Quelle est la charge de travail par semaine ?

    La charge de travail hebdomadaire est estimé à 5 à 10 h en fonction des profils et du niveau jusqu'au quel les participants veulent aller.
    Étant donné que la formation est basée sur un projet d'entreprise, chaque participant se positionne comme il veut.
    Certains veulent aller le plus loin possible jusqu'à un niveau de R&D et d'autres souhaitent comprendre de manière synthétique le fonctionnement d'un projet Big Data.

  • Est-ce qu'à la fin de la formation, je peux me considérer comme Data Engineer ?

    À la fin de la formation, vous serez opérationnel pour participer à un projet Data Engineering en entreprise de A à Z.
    Évidemment votre apprentissage continuera tout au long de votre carrière mais vous aurez déjà tous les outils nécessaires pour être autonome et attaquer des problèmatiques complexes.

  • Y a-t-il un accompagnement après la fin de la formation ?

    À la fin de la formation, Blent vous met en relation les participants qu'ils estiment devenus opérationnels avec des entreprises partenaires qui recrutent.
    De plus, vous aurez accès à un outil d'évaluation qui vous permettra de vous préparer aux entretiens techniques.
    Sans oublier la Blent Family qui pourra vous aider à trouver le job de vos rêves !

  • Quels sont les financements possibles?

    Si vous êtes actuellement en entreprise, vous pouvez te faire financer la formation en formulant une demande à vos managers ou les Ressources Humaines.
    Vous pouvez également utiliser votre Compte Personnel de Formation ou CPF pour financer la formation.
    Vous aurez également la possibilité de payer la formation en 3x sans frais.

  • Qu'est-ce que la Blent Family ?

    La Blent Family est une communauté d'entraide qui regroupe des Data Scientists, Data Engineers, Data Analysts, Managers, Chercheurs, des personnes motivées pour être à la pointe de la Data. Une fois que vous y rentrez, c'est pour la vie !