Introduction au Machine Learning
Prix : 1 500€
par Jungle Program
Jungle Program permet aux développeurs et software engineers d’accélérer leur carrière en machine learning.
Vous suivrez un programme d’accompagnement de 8 semaines à temps partiel conçu par les CTO des meilleurs startups.
En rejoignant ces cours live, vous apprendrez toutes les compétences nécessaires pour transformer les datas brutes de vos clients en informations utiles pour accélérer. Cela comprend la pratique du data munging, data exploration, machine learning et la formation sur les meilleures bibliothèques Python.
Jungle Program est animé par une communauté de développeurs réunis par un désir commun d'expérimenter, d'apprendre et de partager les meilleures connaissances pratiques au quotidien.
La formation est dispensée en anglais.
⏱ 8 semaines (temps partiel)
📅 Prochaines sessions : 14 février et 21 mars 2022
📚 classe virtuelle
💶 1 500€
Si vous n'avez plus de crédits CPF, il existe d'autres modes de financement. Contactez-nous si vous avez besoin d'aide.
Vous pouvez également nous contacter au 06 30 90 99 06.
Apprendre toute la théorie et les compétences pratiques nécessaires pour charger, manipuler et analyser des ensembles de données structurées et non structurées.
Avoir une expérience pratique de la création et de l'évaluation des modèles en Machine Learning.
Être prêt(e) à rejoindre une équipe de data science.
Jungle Program
Amric Trudel
L'analyse des données dans ses moindres détails : vous apprendrez à charger, nettoyer et manipuler des ensembles de données de base en Python : NumPy & Pandas.
Familiarisez-vous avec les deux bibliothèques au cœur de l'analyse des données en Python (NumPy et Pandas) :
- Expliquer les différences entre ndarrays, Series et DataFrames
- Construire et effectuer des opérations de base avec ces structures de données
- Comprendre la nécessité de bibliothèques efficaces pour les mathématiques et l'analyse de données
Découvrez les pouvoirs d'exploration des données de Pandas :
- Indexer et sélectionnez dans les DataFrames
- Nettoyer et remplacez les valeurs manquantes
- Combiner et fusionner des ensembles de données
Testez vos compétences en matière d'exploration de données en analysant les 50 meilleures chansons de l'ensemble de données Spotify 2019 avec Pandas :
- Regroupement et agrégation des lignes
- Calculer de nouvelles variables
- Répondre à des questions statistiques sur l'ensemble de données
Apprenez à extraire et à communiquer des informations clés à partir de séries chronologiques (Time Series Data), de textes et d'ensembles de données d'images (Natural Language Processing, Computer Vision)
Organisez les données de séries chronologiques avec Pandas :
- Manipuler les indices temporels
- Calculer des statistiques glissantes
- Rééchantillonner des séries temporelles
- Interpoler les valeurs manquantes
Faites vos premiers pas dans le monde du traitement du langage naturel (NLP) et de la Computer Vision :
- Opérer sur des chaînes de caractères python et construire des expressions régulières
- Tokeniser et trouver des entités dans du texte avec spacy
- Manipuler des images avec pillow
Exploitez la visualisation des données pour explorer et communiquer :
- Apprendre les bases de la culture des données et de la culture visuelle
- Créer des graphiques avec matplotlib
- Formater les graphiques pour les rendre plus efficaces
- Créer des graphiques avancés
La puissance analytique : ce chapitre ajoute le regroupement, la réduction de la dimensionnalité et la détection des anomalies à vos techniques d'analyse des données.
Regroupez un ensemble de données géospatiales à l'aide de k-Means :
- Explorer les données en utilisant le clustering
- Implémenter k-means avec sklearn
- Visualiser des données géospatiales
- Construire un graphique de ligne de crête
Réduire la dimensionnalité d'un ensemble de données en utilisant PCA :
- Utiliser la réduction de la dimensionnalité pour compresser des images
- Implémentation de l'ACP sur un jeu de données d'emoji avec sklearn
- Analyser la variance expliquée cumulative d'un modèle PCA
- Utiliser la réduction de la dimensionnalité pour la visualisation des données
Utilisez les distributions gaussiennes pour détecter les anomalies dans un ensemble de données d'image :
- Implémenter la détection d'anomalies par distribution gaussienne avec sklearn
- Déboguer l'optimisation d'un algorithme d'apprentissage
- Discuter de l'imperfection des algorithmes d'apprentissage
- Découvrir d'autres méthodes de détection des anomalies
Modèles prédictifs pour résoudre des tâches fondamentales en machine learning.
Comprendre les différents types d'algorithmes d'apprentissage et les tâches d'apprentissage automatique :
- Définir les caractéristiques et les étiquettes
- Comparer l'apprentissage supervisé et non supervisé
- Différencier la classification et la régression
- Explication des bases des procédures d'optimisation
Utilisez la régression linéaire pour prédire le bonheur des pays :
- Décrire un problème de régression
- Ajuster un modèle de régression linéaire à un ensemble de données
- Visualiser les prédictions d'un modèle de régression linéaire entraîné
Utilisez la régression logistique pour prédire la qualité des vins :
- Décrire le problème de classification
- Ajuster un modèle de régression logistique à un ensemble de données
- Visualiser la limite de décision d'un modèle de régression logistique entraîné
Modèles prédictifs pour résoudre des tâches fondamentales en machine learning.
Évaluez les modèles d'apprentissage automatique pour prédire leurs performances futures :
- Diviser les ensembles de formation, de validation et de test avec sklearn
- Exécuter des expériences d'apprentissage automatique de bout en bout
- Comparer la qualité des modèles
- Ajuster un hyperparamètre
Renforcez vos caractéristiques avec des mises à l'échelle et des polynômes pour améliorer la précision du modèle :
- Mettre à l'échelle et réduisez une matrice d'éléments en utilisant la normalisation
- Calculer des caractéristiques polynomiales
- Utiliser les deux méthodes pour optimiser l'ajustement d'un modèle de régression
Régularisez un modèle pour améliorer ses propriétés de généralisation :
- Sur-ajustement d'un modèle de régression polynomial
- Utiliser la régularisation ridge pour éviter le sur-ajustement
- Analyser l'effet du poids de la régularisation sur la taille des paramètres du modèle
- Entrainer un modèle de régression logistique régularisé avec des caractéristiques polynomiales
Ce chapitre présente les modèles Naive Bayes, Decision Trees et Support Vector Machines (SVM), et les renforce avec des méthodes d'ensemble.
Utilisez les SVM pour détecter les billets de banque frauduleux :
- Entraînement des SVM linéaires et à noyau RBF
- Visualiser et comparer les limites de décision des classifieurs à grande marge
- Analyse de l'effet des hyperparamètres de régularisation
Continuez à détecter les faux billets de banque avec Naive Bayes et les arbres de décision :
- Entraînement et évaluation d'un classificateur Naive Bayes
- Entraînement et évaluation d'un arbre de décision
- Effectuer une analyse des erreurs pour mieux comprendre les hyperparamètres du modèle
L'union fait la force, combinez les modèles pour améliorer la précision :
- Utiliser le bagging pour former des modèles de forêt aléatoire
- Utiliser le boosting pour former des modèles AdaBoost et XGBoost
- Analyser les compromis entre précision et performance dans les modèles d'ensemble
Testez vos compétences sur un ensemble de données publiques en réalisant un rapport d'analyse exploratoire des données et en formant au moins un modèle d'apprentissage automatique.
Un apprentissage en ligne avec une classe motivée
Oui. Faites un essai gratuit de 5 jours. Vous ne paierez rien, sauf si vous décidez de continuer.
Oui, les cours en ligne sont conçus pour toute personne ayant un emploi à temps plein. Vous pouvez suivre votre formation pendant votre temps libre.
Jungle Program vous offre le mentorat dont vous avez besoin pour faire passer votre carrière au niveau supérieur. Ils resteront en contact et vous guideront tout au long de votre carrière, où qu'elle vous mène.
Chaque semaine, vous recevrez une série de devoirs pratiques qui guideront votre progression. Vous aurez l'occasion de montrer vos compétences, vos connaissances et votre expertise par le biais d'exercices, d'un projet final et d'une évaluation par l'équipe d'enseignants. À l'issue de la formation, vous deviendrez un Data Scientist certifié du programme Jungle.