Global Knowledge

Big Data : Architecture et technologies

Par Global Knowledge

Objectifs

  • Découvrir les concepts clés du Big Data
  • Comprendre l’écosystème technologique d’un projet Big Data
  • Apprendre à mettre en œuvre une solution Big Data,
  • Avoir une vue d’ensemble sur les possibilités du Big Data

Programme

Comprendre les concepts clés et les enjeux du Big Data

  • Les origines du Big Data
  • La valeur de la donnée : un changement d'importance.
  • La donnée en tant que matière première
  • Les chiffres clés du marché dans le monde et en France.
  • Les enjeux du Big Data : ROI, organisation, confidentialité des données.

Technologies du Big Data

  • Architecture et composants de la plateforme Hadoop
  • Les modes de stockage (NoSQL, HDFS)
  • Fonctionnement de MapReduce et Yarn
  • Principales distributions Hadoop
  • Les technologies émergentes : Spark, Storm, Machine Learning
  • Démarche d'installation d'une plateforme Hadoop
  • Présentation des technologies spécifiques pour le Big Data

Traitement des données Big Data

  • Fonctionnement de Hadoop Distributed File System (HDFS)
  • Importer des données vers HDFS
  • Traitement des données avec PIG
  • Requêtes SQL avec HIVE
  • Création de flux de données massives avec un ETL

Data Vizualisation, représenter des données de façon visuelle

  • Principales solutions du marché
  • Aller au-delà des rapports statiques
  • La Data Visualisation et l'art de raconter des chiffres de manière créative et ludique
  • Cas pratiques : mesurer l'e-réputation, la notoriété d'une marque, l'expérience et la satisfaction clients

Conclusions

  • Les conditions du succès
  • Synthèse des meilleures pratiques
  • Bibliographie

Pédagogie

Appréciation : évaluation qualitative de fin de stage

Modalités et moyens pédagogiques : démonstrations, cas pratiques, synthèse et évaluation des acquis

Support de cours en français remis à chaque participant

Formations de la même catégories (5)

M2i Formation
MapR - Architecture et administrationPar M2i Formation
  • Décrire l'administration des clusters MapR.
Dawan
Informix Database Initiation + ApprofondissementPar Dawan

Réaliser des schémas et requêtes quelconques sur Informix - Décrire l'architecture multi-tà¢ches IBM Informix Dynamic Server - Installer, maintenir, administrer et optimiser un serveur IDS

Global Knowledge
Big Data : Architecture et technologiesPar Global Knowledge

Ce cours de synthèse vous présentera les enjeux et les apports du Big Data ainsi que les technologies pour sa mise en œuvre. Vous apprendrez à gérer un projet de gestion de données massives depuis l'installation d'une plateforme Big Data, tout en passant par la gestion, l'analyse et la visualisation des données.

Dawan
Apache Kafka : Echange de donnéesPar Dawan

Comprendre l'architecture de Kafka et ses cas d'utilisation - Utiliser les APIs Kafka - Administrer un cluster - Construire une architecture haute-disponibilité - Sécuriser un cluster

Orsys
Flink, développer des applications pour le Big DataPar Orsys

Apache Flink est un Framework BigData récent. Il simplifie les traitements de flux gros débit temps réels comme les traitements batch sur d'énormes quantités de données (sur Hadoop HDFS, sur Amazon S3, sur MongoDB...). Ce cours vous permet d'installer Flink et de réaliser, en Java, des traitements variés de Big Data.