Pensez comme un Data Scientist – Machine Learning & Python

par Retengr


Plus d’un tiers des ventes du site Amazon.com est généré grâce à leur moteur de recommandation. Leurs algorithmes de Machine Learning leur a aussi révélé que les recommandations sont d’autant plus efficaces que lorsqu’elles sont faîtes lors d’une campagne mail plutôt qu’un affichage sur la page web.


Segmentation (clustering), prédiction, estimation, recommandation, ces méthodes d’analyse sont aujourd’hui utilisées dans l’objectif d’apporter de la valeur aux données détenues par l’entreprise.
 Si l’implémentation de ces algorithmes reste de la responsabilité du mathématicien, leurs usages est maintenant rendu possible par l’apparition de librairies masquant une partie de leur complexité. A l’issue de cette formation vous aurez appris les activités du Data Scientist : Choix et préparation des données, sélection des algorithmes, apprentissage, scoring, industrialisation.


📅  4 jours à temps plein

📚  classe virtuelle ou en presentiel

💶 2 400€


Pour en savoir + sur le programme ou échanger avec l'organisme de formation c'est par ici 

⬇️



Faites financer cette formation !

Cet Organisme de Formation est certifié Qualiopi, vous pouvez mobiliser les dispositifs de financement de l'Etat.

Contactez-nous si vous avez besoin d'aide.



Vous pouvez également nous contacter au 06 30 90 99 06.

Pour qui est fait ce programme

La connaissance d’un langage de programmation structuré est nécessaire

  • Architectes

  • Développeurs

  • Chefs de projet technique

Avec ce programme vous pourrez :

  • Comprendre le Machine Learning et l’Intelligence Artificielle.

  • Catégoriser les différentes approches : clustering, classification, régression…

  • Choisir, structurer et adapter les données pertinentes pour des résultats pertinents.

  • Apprendre le langage python et ses librairies scientifiques (scikit-learn, pandas).

  • Mettre en œuvre des cas concrets (prédiction, clustering).

  • Mesurer la pertinence des modèles mis en œuvre.

  • Traiter des gros volumes de données en parallélisant les traitements : Spark et Dask.

  • Déployer un modèle en production.

  • Avoir une introduction au Deep Learning.

L'organisme de formation

Retengr

À travers un service personnalisé, flexible et intelligent, Retengr accompagne dans une atmosphère chaleureuse vers la performance, le tout avec empathie et professionnalisme.

Vous allez adorer Retengr si vous pensez que...

- Une formation doit être au service de la performance du collaborateur et de l’entreprise

- L’expertise technique est aussi importante que les qualités pédagogiques

- Un cadre d’apprentissage soigné permet une formation plus efficace

- “Qui cherche la perfection obtient l’excellence”

Votre instructeur


Alexia Audevart

Alexia est data scientist et fondatrice de la société datactik.
Son métier se décompose en 3 parties :
Une première partie “expertise et développement” autour de la valorisation des données.
La seconde concerne la formation data, que ce soit auprès d’étudiants ou d’un public de professionnels comme avec Retengr.
Et la dernière qu'elle appelle “partage de connaissances”. En effet, elle intervient régulièrement lors de conférences. Elle a d’ailleurs animé un TEDx à la Baule sur l’impact de l’IA et des neurosciences sur l’apprentissage.

Curriculum du programme

Les bases du machine learning

  • Quelques exemples en guise d’introduction
  • Généraliser : un principe fondateur du Machine Learning pour permettre la prédiction et la segmentation
  • Algorithmes supervisés et non supervisés
  • Appropriation du vocabulaire du Data Scientist


Premiers pas

  • Collecter et stocker les données
  • Analyser, comprendre, nettoyer et structurer les données : Le Feature Engineering
  • Apprentissage et création d’un modèle
  • Evaluation du modèle
  • Amélioration du modèle


Le langage python

  • La syntaxe du langage
  • Les outils de développement : Jupyter notebook
  • Les librairies du data scientist : Pandas, Scikit-learn
  • Analyser et comprendre les données
  • Matplotlib et Seaborn : Des librairies de data visualisation pour Python


Choisir les algorithmes de machine learning

  • Comprendre les enjeux
  • Tour d’horizon des principaux algorithmes
  • Classification : k-Nearest Neighbors (k-NN),
  • Arbre de décision, Random Forest, XGBoost
  • Régression : Régression logistique
  • Clustering : K-Means, DBScan
  • Les différentes méthodes de scoring


Concepts avancés

  • Validation croisée
  • Ensemble Machine Learning : cumulez les algorithmes pour une meilleure précision
  • Automatiser les manipulations de données avec un pipeline


Traiter les données en parallèle

  • Pourquoi paralléliser ?
  • Adapter les algorithmes
  • Une complexité complémentaire
  • Les frameworks de distribution à disposition : Spark et Dask


Déployer en production

  • Intégrer un pipeline à une chaine de déploiement automatisée (continuous delivery)
  • Packager un modèle : Predicive Model Markup Language
  • Créer un endpoint REST avec python Flask
  • Déployer dans le cloud


Le Deep Learning

  • Présentation générale : les réseaux de neurones
  • Les réseaux convolutionnels : Analyse d’images
  • Les réseaux récurrents
  • Comprendre par l’exemple : Pytorch & Keras

Qu'en pensent les alumni ?

Moïse TOSSOU

CEO Easy Center, Corp Consulting

Max est un très bon professeur. Excellent ! Bravo !

Damien Laboulle

Responsable Production, Groupe Elithis

Daniel est un très bon formateur qui sait capter l'attention de son auditoire. Heureusement ,car 4 jours de formation, ce n'est pas facile de tout le temps rester concentré. Impressionnant dans la compréhension des problèmes de chacun et dans la restitution de ces problèmes en termes simples, compris par tous. Agréable d'avoir à faire à quelqu'un avec une grosse culture et qui reste très humble.

En classe virtuelle ou présentiel (à Paris, Toulouse)

Composée à 70% de pratique, cette formation utilise des exercices illustrés et didactiques.

Une évaluation quotidienne de l’acquisition des connaissances de la veille est effectuée.

Une synthèse est proposée en fin de formation.

Une évaluation à chaud sera proposée au stagiaire à la fin du cours. Un support de cours sera remis à chaque participant comprenant les slides sur la théorie, les exercices. Une feuille d’émargement par demi-journée de présence est fournie en fin de formation ainsi qu’une attestation de fin de formation si le stagiaire a bien assisté à la totalité de la session.

Un suivi et un échange avec les participants seront mis en place quelques jours après la formation.

Une journée type de formation à distance se décompose de la façon suivante :

Matin :
- 2h de théorie en visioconférence
- 10 à 15 minutes de présentation d’exercices en visio
- 1h de TP en autonomie avec possibilité de solliciter le formateur (partage d’écran à distance pour une assistance efficace).

Après-midi :
- 2h de théorie en visioconférence
- 10 à 15 minutes de présentation d’exercices en visio
- 1h de TP en autonomie avec possibilité de solliciter le formateur (partage d’écran à distance pour une assistance efficace).