M2i Formation

Big Data - Le développement d'applications et la Data Visualisation

Par M2i Formation

Objectifs

  • Développer des applications avec Spark
  • Utiliser la programmation parallèle sur un cluster
  • Reconnaître et exploiter les algorithmes standard de Machine Learning
  • Utiliser les bibliothèques Python pour le Machine Learning
  • Décrire le cycle d'un projet Data Science.

Programme

Vue d'ensemble du Big Data

  • Introduction au Big Data : de quoi s'agit-il ?
  • Perspectives offertes par le Big Data
  • Les acteurs du Big Data
  • Exemples pratiques
  • Démystification du Big Data
  • Les technologies concernées
  • Les différents métiers du Big Data

Rappel

  • Le langage Python
  • Les mathématiques de base
    • Algèbre
    • Statistiques
    • Probabilités
  • Le langage SQL

Machine Learning : algorithme

  • Les concepts du Machine Learning
  • Les données supervisées ou non supervisées : quelles différences ?
  • Régression
  • Modèles linéaires
  • Classification
  • Naive Bayes
  • K-NN
  • K-Means clustering
  • Réseaux de neurones
  • Arbres de décisions et de régression
  • Support Vector Machines (SVM)

Machine Learning avec Spark

  • Introduction à Apache Spark
  • Faire du Machine Learning avec Apache Spark MLlib
  • Traiter les données en temps réel avec Apache Spark Streaming
  • Faire des requêtes au format SQL avec Apache Spark SQL
  • Créer des graphes avec Apache Spark GraphX
  • Stockage basé sur les graphes

Outil de visualisation des données (ou Dataviz)

  • Définition de la Dataviz
  • Les acteurs de la Dataviz
  • Catégorisation des outils Dataviz
  • Comment fonctionnent les outils Dataviz ?
  • Exemples d'analyse :
    • Bibliothèques de Dataviz de Python
    • Kiaban
    • Tableau Software
    • Hue

Certification (en option)

  • Prévoir l'achat de la certification en supplément
  • L'examen (en français) sera passé le dernier jour, à l'issue de la formation et s'effectuera en ligne
  • Il s'agit d'un QCM dont la durée moyenne est d'1h30 et dont le score obtenu attestera d'un niveau de compétence
  • NB : Certification M2i "Expertises Big Data" valide jusqu'au 31/12/2021. N'hésitez pas à contacter votre Conseiller Formation pour toute information complémentaire

Pédagogie

  • En cours de formation, par des études de cas ou des travaux pratiques
  • Et, en fin de formation, par un questionnaire d'auto-évaluation ou une certification (M2i ou éditeur)

Formations de la même catégories (5)

Dawan
Informix Database Initiation + ApprofondissementPar Dawan

Réaliser des schémas et requêtes quelconques sur Informix - Décrire l'architecture multi-tà¢ches IBM Informix Dynamic Server - Installer, maintenir, administrer et optimiser un serveur IDS

Global Knowledge
Big Data : Architecture et technologiesPar Global Knowledge

Ce cours de synthèse vous présentera les enjeux et les apports du Big Data ainsi que les technologies pour sa mise en œuvre. Vous apprendrez à gérer un projet de gestion de données massives depuis l'installation d'une plateforme Big Data, tout en passant par la gestion, l'analyse et la visualisation des données.

Dawan
Apache Kafka : Echange de donnéesPar Dawan

Comprendre l'architecture de Kafka et ses cas d'utilisation - Utiliser les APIs Kafka - Administrer un cluster - Construire une architecture haute-disponibilité - Sécuriser un cluster

Orsys
Flink, développer des applications pour le Big DataPar Orsys

Apache Flink est un Framework BigData récent. Il simplifie les traitements de flux gros débit temps réels comme les traitements batch sur d'énormes quantités de données (sur Hadoop HDFS, sur Amazon S3, sur MongoDB...). Ce cours vous permet d'installer Flink et de réaliser, en Java, des traitements variés de Big Data.

Orsys
Introduction à la datavisualisation, collecter, traiter et représenter les donnéesPar Orsys

Cette vidéo de formation, qui débute par un rapide historique sur la datavisualisation, a pour but de vous aider à comprendre quelles sont les règles à respecter pour créer des graphiques efficaces. Nous verrons qu'une mauvaise représentation graphique peut induire en erreur le lecteur et mener à de mauvaises décisions. Ainsi, au cours de cette vidéo, nous verrons quels processus mettre en oeuvre pour récolter les données puis les traiter avant de les afficher. Nous évoquerons aussi les règles à respecter pour appliquer le bon type de graphique, comment le réaliser et le mettre en forme de façon efficiente en choisissant les bonnes couleurs et les bons axes de lecture. Quelques séquences de mise en pratique vous montrent concrètement comment récolter, traiter les données et concevoir des graphiques pertinents (Excel, Tableau, Sanddance, CartoDB...).