Global Knowledge

Big Data : Les bases NoSQL

Par Global Knowledge

Objectifs

  • Comprendre le principe des bases NoSQL
  • Savoir utiliser les bases NoSQL
  • Savoir choisir le modèle de base NoSQL qui répond le plus aux besoins
  • Comprendre le fonctionnement de HBase, Elastic Search et Cassandra et savoir les manipuler

Programme

  • Introduction
  • Concept des bases de données relationnelles
  • Big Data et nouvelles caractéristiques des données
  • Les évolutions–données, traitements et infrastructures
  • Nouveaux besoins en gestion des données
  • Limites des SGDB relationnels
  • Concept du NoSQL
  • Théorème de Cap
  • SQL vs NoSQL
  • Données structurées vs non structurées
  • CAP vs ACID
  • Table vs document
  • Schéma des données
  • Requêtes
  • Transactions
  • Syntaxe
  • Caractéristiques – performance, scalabilité, etc…
  • Le NoSQL
  • Caractéristiques générales
  • Architecture distribuée
  • Critères de choix d’une base NoSQL
  • Principaux modèles de BDD NoSQL : Modèles orientés Key-Valeur, Document, Colonne, Graphe
  • Panorama des principales solutions NoSQL : Hbase, CouchDB, Cassandra , MongoDB, ElasticSearch, Neo4j
  • HBase – Stockage Hadoop
  • Présentation générale – Hadoop
  • Caractéristiques – Architecture
  • Organisation logique des données
  • Organisation physique des données - Configuration distribuée
  • Communication avec HBase : HBase Shell, API
  • ElasticSearch – Base orientée document
  • Présentation générale & Historique
  • Architecture et technologies utilisées
  • Concepts de base : Index, Document, Cluster, Nœuds, Réplique
  • Le format JSON
  • API Rest
  • Fonctionnement
  • Kibana et Logstash
  • Cassandra – Base orientée colonne
  • Présentation générale & Historique
  • Architecture & cas d’utilisation
  • Installation
  • CQL – Requêtes
  • Modèles de données
  • Colonnes – paires
  • Lignes – documents
  • Les tables – familles des colonnes
  • Les bases – keyspaces
  • Conception d’un schéma
  • Création de base

Pédagogie

Travaux pratiques

Alternance entre les concepts théoriques et la mise en pratique à travers des exercices de réflexion, d’installation ou de programmation sur les différentes parties de la formation.

Un support de cours en français est remis à chaque participant.

Formations de la même catégories (5)

M2i Formation
MapR - Architecture et administrationPar M2i Formation
  • Maîtriser l'administration des clusters MapR.
Dawan
Informix Database Initiation + ApprofondissementPar Dawan

Réaliser des schémas et requêtes quelconques sur Informix - Décrire l'architecture multi-tâches IBM Informix Dynamic Server - Installer, maintenir, administrer et optimiser un serveur IDS

Global Knowledge
Big Data : Architecture et technologiesPar Global Knowledge

Ce cours de synthèse vous présentera les enjeux et les apports du Big Data ainsi que les technologies pour sa mise en œuvre. Vous apprendrez à gérer un projet de gestion de données massives depuis l'installation d'une plateforme Big Data, tout en passant par la gestion, l'analyse et la visualisation des données.

Dawan
Apache Kafka : Echange de donnéesPar Dawan

Comprendre l’architecture de Kafka et ses cas d’utilisation - Utiliser les APIs Kafka - Administrer un cluster - Construire une architecture haute-disponibilité - Sécuriser un cluster

Orsys
Flink, développer des applications pour le Big DataPar Orsys

Apache Flink est un nouvel outil de traitement de Big Data de quatrième génération qui change le paysage des technologies de traitement des données. Ce cours vous permettra d’utiliser Apache Flink pour développer des applications en Java en vue de traiter des flux massifs de données issues du Big Data en temps réel.