Formations Apache Hadoop

Page 3 sur 6
Demos
Cloudera Spark avec Hadoop pour Développeurs (Certifiant CCA)Par Demos
  • intégrer et enregistrer des données dans un cluster Hadoop avec les techniques et les outils les plus récents
  • identifier et à utiliser les outils appropriés à chaque situation (utilisation de Spark, Hive, Flume, Sqoop et Impala afin de bénéficier de la meilleure préparation possible pour faire face aux défis quotidiens auxquels sont confrontés les développeurs Hadoop)
Orsys
Hadoop, installation et administrationPar Orsys

La plateforme Apache Hadoop est la première solution a avoir réellement rendu possibles des traitements (distribués) sur d'énormes quantités de données. Ce cours vous montrera comment installer, configurer et administrer un cluster Hadoop ainsi que d'autres composants de l'écosystème (Hive, Pig, HBase, Flume...).

SQLI Institut
AWS : BigData avec Hadoop EMRPar SQLI Institut
  • Savoir mettre en oeuvre les techniques de calcul distribué avec Hadoop EMR
Orsys
Big Data, introduction à la plateforme Hadoop et à son écosystèmePar Orsys

Cette vidéo a pour objectif de vous présenter le Big Data en général et plus spécifiquement la plateforme Hadoop et ses concepts clés, afin de comprendre son fonctionnement et ses possibilités. Après avoir défini les notions de NoSQL et de Big Data, nous lancerons l'installation d'un environnement Hadoop. Celui-ci étant complexe et composé de nombreuses couches, nous utiliserons les distributions Hadoop comme Hortonworks, MapR et Cloudera. Puis, nous introduirons le paradigme Map Reduce qui permettra de réaliser des algorithmes de calcul distribué. Nous l'illustrerons par un exemple simple en Java. Nous détaillerons, ensuite, les concepts principaux autour du stockage et du traitement des données dans Hadoop. Nous les mettrons en pratique par des exemples simples illustrant la théorie. Enfin, nous terminerons en étudiant une collection d'outils basés sur Hadoop et leurs différentes possibilités et utilités. Nous évoquerons entre autres la base NoSQL d'Hadoop : HBase, les outils de traitement Pig, Hive et Spark.

Openska
ClouderaPar Openska

Cette formation Hadoop – Cloudera Développeur vous permettra de définir et de développer des applications MapReduce(Yarn), Hive et Pig efficaces avec Hadoop 2.0.
Vous serez à même d’exploiter toute la puissance d’Hadoop 2.0 pour la manipulation, l’analyse et l’exécution des calculs sur le cluster Hadoop.

Feel Europe
SPARKPar Feel Europe
  • Maîtriser les concepts fondamentaux de Spark
  • Développer des applications avec Spark Streaming
  • Faire de la programmation parallèle avec Spark sur un cluster
  • Exploiter des données avec Spark SQL
  • Avoir une première approche du Machine Learning
Demos
Hadoop - Hortonworks pour Architectes et AdministrateursPar Demos
  • disposer des connaissances pour déployer, maintenir et optimiser un cluster Hadoop-Hortonworks
  • savoir exploiter et gérer un cluster Hadoop
  • être en mesure de configurer Hadoop et ses outils
Le Pont Learning
Hadoop - Cloudera / Hortonworks pour développeursPar Le Pont Learning

Cette formation Hadoop – Cloudera / Hortonworks pour développeurs vous permettra :

  • Réaliser une étude en profondeur dans les développements des applications Hadoop 2.0
  • Définir et à développer des applications MapReduce(Yarn), Hive et Pig efficaces et pertinentes avec Hadoop 2.0
  • Exploiter toute la puissance d'Hadoop 2.0 pour manipulation, analyse et exécution des calculs sur leur cluster Hadoop
Data Value
Analyse de données en environnement HadoopPar Data Value

Comprendre ce que sont Hadoop et YARN
Connaître les différents outils et les Framework dans un environnement Hadoop 2.0
Appréhender MapReduce
Comprendre comment exécuter une tâche de MapReduce sur YARN
Exécuter des modifications en masse avec PIG
Savoir écrire des requêtes pour HIVE afin d’analyser ses données
Savoir utiliser Sqoop pour transférer les données entre Hadoop et une base de données relationnelle
Découverte d’autres briques : automatiser vos process avec Oozie
Utiliser une base de données No-SQL (HBase)

Le Pont Learning
Data Analyst - Analyse de données en environnement HadoopPar Le Pont Learning

Cette formation Data Analyst – Analyse de données en environnement Hadoop vous permettra de :

  • Identifier le fonctionnement d'Hadoop Distributed File System (HDFS) et YARN/MapReduce
  • Explorer HDFS
  • Suivre l'exécution d'une application YARN
  • Définir le fonctionnent et utiliser les différents outils de manipulation de la donnée :
  • Hue : Utilisation de l'interface unifiée
  • Hive, Pig : Les générateurs de MapReduce
  • Tez : L'optimisation des générateurs de MapReduce
  • Sqoop : Comment importer les données de l'entreprise dans un cluster Hadoop?
  • Oozie : Comment organiser les exécutions des différentes applications ?