Formation Apache Spark
Prix : 1 980€
par Retengr
Apache Spark est un moteur de traitements distribués sur des gros volumes de données.
Souvent mis en opposition au modèle mapreduce implémenté dans Hadoop, il en est en fait une extension qui peut en diviser les temps d’exécution jusqu’à un facteur de 100 en maximisant le travail « in-memory ».
Spark exploite les principes de programmation fonctionnelle afin d’optimiser l’empreinte mémoire nécessaire à son exécution. Conçu pour mettre en œuvre des traitements distribués, Spark peut s’appuyer sur plusieurs types de clusters, dont YARN le négociateur de ressources intégré à Hadoop.
📅 4 jours à temps plein
📚 classe virtuelle ou en présentiel
💶 1 980€
Cet Organisme de Formation est certifié Qualiopi, vous pouvez mobiliser les dispositifs de financement de l'Etat.
Contactez-nous si vous avez besoin d'aide.
Vous pouvez également nous contacter au 06 30 90 99 06.
Concevoir une application avec Spark .
Comprendre le principe de distribution des traitements.
Maîtriser les concepts fondamentaux des et des Resilient Distributed Dataset.
Utiliser les dataframes via Spark SQL.
Utiliser SparkUI afin d’analyser les jobs et tâches de Spark.
Positionner SparkML dans un contexte de data science.
Traiter des données en continu avec Spark Streaming.
Retengr
Denis Peyrusaubes
Retengr
Retengr
Retengr
Retengr
Retengr
Retengr
Retengr
Retengr
Retengr
Retengr