Le parcours Data Engineer
Prix : 1 800€ (ou 4 200€ avec coaching individuel)
par Blent.ai
Une formation opérationnelle pour maîtriser toutes les compétences Data Engineering sur un projet d'entreprise, du calcul parallèle à l'automatisation en passant par le processing temps réel.
Un programme complet autour de 5 piliers :
📅 150 heures de e-learning (+ 8 séances de coaching individuelles à la demande)
📚 e-learning (+ coaching en option)
💶 1 800€ (sans coaching) ou 4 200€ (avec coaching). Payable en 3x sans frais.
Si vous n'avez plus de crédits CPF, il existe d'autres modes de financement. Contactez-nous si vous avez besoin d'aide.
Vous pouvez également nous contacter au 06 30 90 99 06.
Écrire des programmes Python robustes pour les systèmes en production.
Utiliser les principaux outils opérationnels tels que Visual Studio Code, Bash ou encore Git.
Utiliser des bases de données NoSQL pour héberger des données volumineuses.
Construire des pipelines ETL en prenant en compte les aspects de chaque base de données source et cible.
Configurer un cluster Hadoop et y exécuter Spark dessus.
Développer des pipelines ETL et des scripts Spark.
Savoir dans quelles situations utiliser et installer Kafka.
Construire des applications robustes et efficients pour le calcul temps réel.
Être capable de développer des programmes d'analyses et de traitement en temps réel avec ksqlDB et Spark Streaming.
Créer des pipelines ETL automatisés, robustes et scalables et déployer des modèles de Machine Learning avec des API REST et des conteneurs.
Blent.ai
Lorsque vous serez officiellement inscrit, Blent.ai vous donnera accès à 30h de cours pour que vous puissiez apprendre les bases en Python, les commandes systèmes Bash et la manipulation de données. Cette phase de préparation est disponible dès votre inscription à la formation, et vous pourrez poser toutes vos questions à leur équipe de professeurs sur Slack.
Ce que vous allez apprendre dans cette phase :
Lors de cette première phase, vous aborderez le stockage des données, et notamment les différentes solutions qui existent. Vous étudierez ces solutions, tant sur le plan économique que technique, sur comment vous allez stocker des centaines de Go de données.
En plus des bases structurées classiques de la famille SQL ou du stockage persistent, vous découvrirez les bases de données orientées documents (MongoDB), les bases de données orientées colonnes distribuées (avec Cassandra et BigQuery) ainsi que les bases de données clé/valeur en mémoire dont Redis est le plus populaire. Enfin, une petite ouverture sur les bases NewSQL sera proposée pour être prêt face aux futures systèmes de gestion de bases de données.
Ce que vous allez apprendre dans cette phase :
Une fois le stockage correctement établi, une des premières choses sur lequel le Data Engineer doit réfléchir est la bonne construction d'un processus ETL (pour Extract Transform Load) afin d'automatiser le processing de la donnée jusqu'à un Data Warehouse.
Du fait de la grande quantité de donnée à disposition, les outils de calcul parallèle, dont Hadoop et Spark sont les plus populaires, vous permettront d'effectuer un nombre impressionnant de calculs en un temps très court grâce aux clusters à disposition dans le Cloud. En complément des processus ETL, les applications dites serverless permettent aujourd'hui de lancer des calculs spécifiques sans se soucier de l'infrastructure cible.
Ce que vous allez apprendre dans cette phase :
Aujourd'hui, beaucoup d'applications alimentent les bases avec des données en temps réel (ou à flot continu) : c’est le Data Streaming. Comment peut-on appliquer un processus ETL efficace ?
Pendant cette phase intermédiaire, vous mettrez en place plusieurs solutions pour le Data Streaming, avec notamment des architectures publish-subscribe avec Apache Kafka. Vous verrez également Confluent Platform, qui apporte de nouvelle fonctionnalités puissantes à Kafka. Vous verrez ensuite comment traiter et analyser ces données en temps réel aussi bien dans un paradigme SQL avec ksqlDB qu'avec l'architecture MapReduce ou les DataFrames de Spark Streaming.
Ce que vous allez apprendre dans cette phase :
Cette dernière étape est la plus importante : c'est elle qui définit comment les applications vont être intégrés dans une infrastructure Cloud.
Véritable institution dans le Cloud Computing, vous verrez la puissance de la conteneurisation d'applications avec Docker, et comment les solutions sur le Cloud permettent de répartir les charges de travail. De plus, les outils d’automatisation sont indispensables pour le Data Engineer : vous utiliserez Airflow, une référence en la matière.
Ce que vous allez apprendre dans cette phase :
Un apprentissage à votre rythme avec le soutien des mentors et des pairs
Même si Blent.ai offre une mise à niveau avant le début de la formation pour avoir les bases en Python et en manipulation des données, il faut tout de même avoir de bonnes notions en programmation.
Une expérience en Java ou en Python serait un vrai plus, même si la maîtrise de ces deux langages n'est pas indispensable pour suivre la formation : une bonne connaissance de SQL sera suffisante.
La charge de travail hebdomadaire est estimé à 5 à 10 h en fonction des profils et du niveau jusqu'au quel les participants veulent aller.
Étant donné que la formation est basée sur un projet d'entreprise, chaque participant se positionne comme il veut.
Certains veulent aller le plus loin possible jusqu'à un niveau de R&D et d'autres souhaitent comprendre de manière synthétique le fonctionnement d'un projet Big Data.
À la fin de la formation, vous serez opérationnel pour participer à un projet Data Engineering en entreprise de A à Z.
Évidemment votre apprentissage continuera tout au long de votre carrière mais vous aurez déjà tous les outils nécessaires pour être autonome et attaquer des problèmatiques complexes.
À la fin de la formation, Blent vous met en relation les participants qu'ils estiment devenus opérationnels avec des entreprises partenaires qui recrutent.
De plus, vous aurez accès à un outil d'évaluation qui vous permettra de vous préparer aux entretiens techniques.
Sans oublier la Blent Family qui pourra vous aider à trouver le job de vos rêves !
Si vous êtes actuellement en entreprise, vous pouvez te faire financer la formation en formulant une demande à vos managers ou les Ressources Humaines.
Vous pouvez également utiliser votre Compte Personnel de Formation ou CPF pour financer la formation.
Vous aurez également la possibilité de payer la formation en 3x sans frais.
La Blent Family est une communauté d'entraide qui regroupe des Data Scientists, Data Engineers, Data Analysts, Managers, Chercheurs, des personnes motivées pour être à la pointe de la Data. Une fois que vous y rentrez, c'est pour la vie !