Une formation pratique de 8 semaines pour apprendre à transformer des ensembles de données brutes grâce au machine learning.

par Jungle Program


Jungle Program permet aux développeurs et software engineers d’accélérer leur carrière en machine learning.

Vous suivrez un programme d’accompagnement de 8 semaines à temps partiel conçu par les CTO des meilleurs startups.

En rejoignant ces cours live, vous apprendrez toutes les compétences nécessaires pour transformer les datas brutes de vos clients en informations utiles pour accélérer. Cela comprend la pratique du data munging, data exploration, machine learning et la formation sur les meilleures bibliothèques Python.

Jungle Program est animé par une communauté de développeurs réunis par un désir commun d'expérimenter, d'apprendre et de partager les meilleures connaissances pratiques au quotidien.

La formation est dispensée en anglais.


Durée : 8 semaines (temps partiel)

Format : cohorte en ligne

Prix : 1 500€

Utilisez votre CPF pour financer cette formation

Si vous n'avez plus de crédits CPF, il existe d'autres modes de financement. Contactez-nous si vous avez besoin d'aide.



Vous pouvez également nous contacter au 06 30 90 99 06.

Pour qui est fait ce programme

Il est recommandé d'avoir un peu d'expérience en Python (e.g définir une fonction) et quelques notions de statistiques.

  • Les programmeurs débutants qui cherchent à se lancer dans une carrière en data science

  • Les software engineers curieux de découvrir ce qu'est le machine learning

  • Les passionnés d'IA à la recherche d'une expérience pratique

Avec ce programme vous pourrez :

  • Apprendre toute la théorie et les compétences pratiques nécessaires pour charger, manipuler et analyser des ensembles de données structurées et non structurées.

  • Avoir une expérience pratique de la création et de l'évaluation des modèles en Machine Learning.

  • Être prêt(e) à rejoindre une équipe de data science.

L'organisme de formation

Jungle Program

Chez Jungle Program, leur mission est d'intégrer l'apprentissage dans la vie quotidienne et de rendre les nouvelles habitudes d'apprentissage amusantes et gratifiantes.

Parfois, c'est difficile. C'est pourquoi les ingénieurs et CTO les plus inspirés enseignent chez Jungle Program et facilitent votre parcours d'apprentissage.

Jungle Program est une communauté. Ils forment un groupe de personnes passionnées qui aiment enseigner et apprendre de nouvelles compétences en technologie.

Votre instructeur

Camille Van Hoffelen

Camille a travaillé comme machine learning engineer au cours des sept dernières années (Seal, DocuSign...), en se concentrant sur les systèmes de traitement du langage naturel à grande échelle.

Camille a obtenu un diplôme de physique à l'Imperial College de Londres, avant d'attraper le virus de la data science et de plonger dans l'IA juridique avec Seal Software, racheté ensuite par DocuSign.

Il a été chargé de cours en machine learning à l'université d'État d'Ilia et reste un présentateur assidu lors de rencontres et de hackathons en Europe.

Camille est actuellement le CTO et cofondateur de Watergenics, où il s'efforce de construire un avenir durable pour notre planète bleue en augmentant les capteurs de qualité de l'eau avec l'IA.

Curriculum du programme

Semaine 1. Data Munging (3h de cours en direct).

L'analyse des données dans ses moindres détails : vous apprendrez à charger, nettoyer et manipuler des ensembles de données de base en Python : NumPy & Pandas.

  • > Introduction à Numpy & Pandas

    Familiarisez-vous avec les deux bibliothèques au cœur de l'analyse des données en Python (NumPy et Pandas) :
    - Expliquer les différences entre ndarrays, Series et DataFrames
    - Construire et effectuer des opérations de base avec ces structures de données
    - Comprendre la nécessité de bibliothèques efficaces pour les mathématiques et l'analyse de données

  • > Tabular Data Pt.1

    Découvrez les pouvoirs d'exploration des données de Pandas :
    - Indexer et sélectionnez dans les DataFrames
    - Nettoyer et remplacez les valeurs manquantes
    - Combiner et fusionner des ensembles de données

  • > Tabular Data Pt.2

    Testez vos compétences en matière d'exploration de données en analysant les 50 meilleures chansons de l'ensemble de données Spotify 2019 avec Pandas :
    - Regroupement et agrégation des lignes
    - Calculer de nouvelles variables
    - Répondre à des questions statistiques sur l'ensemble de données


Semaine 2. Exploration de données (3h de cours en direct).

Apprenez à extraire et à communiquer des informations clés à partir de séries chronologiques (Time Series Data), de textes et d'ensembles de données d'images (Natural Language Processing, Computer Vision)

  • > Time Series data

    Organisez les données de séries chronologiques avec Pandas :
    - Manipuler les indices temporels
    - Calculer des statistiques glissantes
    - Rééchantillonner des séries temporelles
    - Interpoler les valeurs manquantes

  • > Texte & images

    Faites vos premiers pas dans le monde du traitement du langage naturel (NLP) et de la Computer Vision :
    - Opérer sur des chaînes de caractères python et construire des expressions régulières
    - Tokeniser et trouver des entités dans du texte avec spacy
    - Manipuler des images avec pillow

  • > Data Visualisation

    Exploitez la visualisation des données pour explorer et communiquer :
    - Apprendre les bases de la culture des données et de la culture visuelle
    - Créer des graphiques avec matplotlib
    - Formater les graphiques pour les rendre plus efficaces
    - Créer des graphiques avancés


Semaine 3. Apprentissage non supervisé (3h de cours en direct).

La puissance analytique : ce chapitre ajoute le regroupement, la réduction de la dimensionnalité et la détection des anomalies à vos techniques d'analyse des données.

  • > Clustering

    Regroupez un ensemble de données géospatiales à l'aide de k-Means :
    - Explorer les données en utilisant le clustering
    - Implémenter k-means avec sklearn
    - Visualiser des données géospatiales
    - Construire un graphique de ligne de crête

  • > Réduction dimensionnelle

    Réduire la dimensionnalité d'un ensemble de données en utilisant PCA :
    - Utiliser la réduction de la dimensionnalité pour compresser des images
    - Implémentation de l'ACP sur un jeu de données d'emoji avec sklearn
    - Analyser la variance expliquée cumulative d'un modèle PCA
    - Utiliser la réduction de la dimensionnalité pour la visualisation des données

  • > Détection d'anomalies

    Utilisez les distributions gaussiennes pour détecter les anomalies dans un ensemble de données d'image :
    - Implémenter la détection d'anomalies par distribution gaussienne avec sklearn
    - Déboguer l'optimisation d'un algorithme d'apprentissage
    - Discuter de l'imperfection des algorithmes d'apprentissage
    - Découvrir d'autres méthodes de détection des anomalies


Semaine 4. Entrainement de modèles (3h de cours en direct).

Modèles prédictifs pour résoudre des tâches fondamentales en machine learning.

  • > Principes fondamentaux de l'apprentissage supervisé

    Comprendre les différents types d'algorithmes d'apprentissage et les tâches d'apprentissage automatique :
    - Définir les caractéristiques et les étiquettes
    - Comparer l'apprentissage supervisé et non supervisé
    - Différencier la classification et la régression
    - Explication des bases des procédures d'optimisation

  • > Régression linéaire

    Utilisez la régression linéaire pour prédire le bonheur des pays :
    - Décrire un problème de régression
    - Ajuster un modèle de régression linéaire à un ensemble de données
    - Visualiser les prédictions d'un modèle de régression linéaire entraîné

  • > Régression logistique

    Utilisez la régression logistique pour prédire la qualité des vins :
    - Décrire le problème de classification
    - Ajuster un modèle de régression logistique à un ensemble de données
    - Visualiser la limite de décision d'un modèle de régression logistique entraîné


Semaine 5. Apprentissage supervisé avancé (3h de cours en direct).

Modèles prédictifs pour résoudre des tâches fondamentales en machine learning.

  • > Principes fondamentaux de l'évaluation

    Évaluez les modèles d'apprentissage automatique pour prédire leurs performances futures :
    - Diviser les ensembles de formation, de validation et de test avec sklearn
    - Exécuter des expériences d'apprentissage automatique de bout en bout
    - Comparer la qualité des modèles
    - Ajuster un hyperparamètre

  • > Learning Better Pt.1

    Renforcez vos caractéristiques avec des mises à l'échelle et des polynômes pour améliorer la précision du modèle :
    - Mettre à l'échelle et réduisez une matrice d'éléments en utilisant la normalisation
    - Calculer des caractéristiques polynomiales
    - Utiliser les deux méthodes pour optimiser l'ajustement d'un modèle de régression

  • > Learning Better Pt.2

    Régularisez un modèle pour améliorer ses propriétés de généralisation :
    - Sur-ajustement d'un modèle de régression polynomial
    - Utiliser la régularisation ridge pour éviter le sur-ajustement
    - Analyser l'effet du poids de la régularisation sur la taille des paramètres du modèle
    - Entrainer un modèle de régression logistique régularisé avec des caractéristiques polynomiales


Semaine 6. Non-Linear Models (3h de cours en direct).

Ce chapitre présente les modèles Naive Bayes, Decision Trees et Support Vector Machines (SVM), et les renforce avec des méthodes d'ensemble.

  • > Support Vector Machine

    Utilisez les SVM pour détecter les billets de banque frauduleux :
    - Entraînement des SVM linéaires et à noyau RBF
    - Visualiser et comparer les limites de décision des classifieurs à grande marge
    - Analyse de l'effet des hyperparamètres de régularisation

  • > Naive Bayes et arbres de décision

    Continuez à détecter les faux billets de banque avec Naive Bayes et les arbres de décision :
    - Entraînement et évaluation d'un classificateur Naive Bayes
    - Entraînement et évaluation d'un arbre de décision
    - Effectuer une analyse des erreurs pour mieux comprendre les hyperparamètres du modèle

  • > Méthode d'ensembles

    L'union fait la force, combinez les modèles pour améliorer la précision :
    - Utiliser le bagging pour former des modèles de forêt aléatoire
    - Utiliser le boosting pour former des modèles AdaBoost et XGBoost
    - Analyser les compromis entre précision et performance dans les modèles d'ensemble


Semaine 7. Projet final (Office hours à la demande).

Testez vos compétences sur un ensemble de données publiques en réalisant un rapport d'analyse exploratoire des données et en formant au moins un modèle d'apprentissage automatique.


Qu'en pensent les alumnis

Amine Amanzou

DevOps at Orange

Je suis impressionné par la méthodologie de Jungle Program et le concept de cours par cohorte. Maintenant que je me sens bien et que je me sens confiant en data science, je peux prendre mon temps et approfondir mes connaissances et ma pratique.

Leonie Malzacher

Aerospace Engineer

C'est un game changer. Vous ne voudrez plus jamais revenir aux cours en ligne traditionnels. Je ne savais pas qu'il y avait une si grande communauté derrière le programme. La communauté est d'un grand soutien à bien des égards, qu'il s'agisse de questions sur le codage, d'outils, d'emplois, de partenaires de projet, et bien sûr, c'est tellement amusant de rencontrer de nouvelles personnes et de se faire de nouveaux amis.

Cohorte en ligne

Un apprentissage en ligne avec une classe motivée

> Formation à temps partiel
> Rejoignez une micro-classe de < 10 étudiants
> Compatible avec un travail à temps plein
> 3 heures de cours interactif en direct par semaine
> 3 à 5 heures d'exercices de codage par semaine
> Journée de démonstration et certification de fin de cours
> Connectez-vous avec d'autres étudiants et apprenez ensemble
> Maîtriser les derniers outils et langages en machine learning
> Appels 1:1 avec les enseignants
> 5 jours d'essai gratuit

FAQ

  • Existe-t-il une période d'essai gratuite ?

    Oui. Faites un essai gratuit de 5 jours. Vous ne paierez rien, sauf si vous décidez de continuer.

  • J'ai un emploi à temps plein. Puis-je assister à la formation ?

    Oui, les cours en ligne sont conçus pour toute personne ayant un emploi à temps plein. Vous pouvez suivre votre formation pendant votre temps libre.

  • Offrez-vous un suivi de l'emploi ?

    Jungle Program vous offre le mentorat dont vous avez besoin pour faire passer votre carrière au niveau supérieur. Ils resteront en contact et vous guideront tout au long de votre carrière, où qu'elle vous mène.

  • Comment serai-je évalué ?

    Chaque semaine, vous recevrez une série de devoirs pratiques qui guideront votre progression. Vous aurez l'occasion de montrer vos compétences, vos connaissances et votre expertise par le biais d'exercices, d'un projet final et d'une évaluation par l'équipe d'enseignants. À l'issue de la formation, vous deviendrez un Data Scientist certifié du programme Jungle.