ProduitBlog
Connexion

Big Data - Etat de l'art

Par Arkesys

Public cible

Toute personne souhaitant se perfectionner dans le domaine concerné.

Objectifs

  • Assimiler les concepts du Big Data
  • Connaître les différentes solutions Big Data disponibles sur le marché
  • Appréhender l'architecture d'un système Hadoop
  • Etre capable d'interroger les données au sein d'un système Hadoop.

Pré-requis

  • Il est conseillé de connaître le langage SQL

Programme

Introduction

  • Les origines du Big Data
  • La donnée en tant que matière première
  • La connaissance de la question

Big Data : des solutions à portée de main

  • Présentation de l'écosystème Hadoop
    • Introduction
    • HDFS
    • MapReduce
    • HBase
    • Pig et Hive
    • Hue
    • Flume
    • Distributions (Cloudera, MapR, Hortonworks)
  • Lucene, Solr
  • Solutions alternatives

Relations entre Cloud et Big Data

  • Motivations des Clouds publics et privés
  • Les Clouds de stockage
  • Traitement des données dans le Cloud

Big Data : traitements, de l'acquisition jusqu'au résultat

  • L'enchainement des opérations
  • La connaissance de la question

Croiser ses données avec le Big Data

  • La structure comme critère de classification : non structurées, structurées, semi structurées
  • Les solutions potentielles

Méthodes de traitement et champs d'application

  • Du SGBDR au NoSQL
  • Les différents types de bases de données
  • Bénéfices : navigation, recherche des données, nouveaux types de données, fédération des entrepôts de données existants

Cas d'usage et conclusion

  • L'anticipation, la sécurité et les recommandations
  • Exemples de cas d'utilisation

Big Data en libre-service

  • Tour d'horizon sur les données Big Data déjà disponibles

Architecture et utilisation des composants Hadoop (théorie et mise en pratique)

  • HDFS
    • Architecture, commandes shell
  • MapReduce
    • Architectures MapReduce v1, YARN
    • Exécution d'un traitement MapReduce
    • Supervision
  • HBase
    • Architecture
    • Utilisation de la base de données NoSQL (famille de colonnes, versions)
  • Hive
    • Architecture, utilisation du langage Hive QL (tables, tables externes, partitions)
    • Interrogation des données

Pédagogie

  • Explications théoriques suivies de pratiques guidées puis mises en autonomie
  • 1 vidéoprojecteur par salle
  • Stage en mode "In Class" : 2 téléviseurs et 1 caméra HD par salle
  • 1 ordinateur par stagiaire
  • Exercices de synthèse et d’évaluation
  • Evaluation de fin de stage

Profil formateur

Nos formateurs sont certifiés à l’issue d’un parcours organisé par nos soins. Ils bénéficient d’un suivi de compétences aussi bien au niveau technique que pédagogique.

Prochaines sessions

Du jeu. 4 avr. 2019 au ven. 5 avr. 2019