M2i Formation

Data Mining - Synthèse

Par M2i Formation

Objectifs

  • Comprendre les principes et la finalité du Data Mining (DM)
  • Identifier les principales techniques du DM et leur cas d'utilisation
  • Mettre en oeuvre les méthodes de scoring et de géomarketing sur un cas simple
  • Découvrir les méthodes prédictives et les méthodes descriptives du DM
  • Connaître les principales étapes d'un projet Data Mining.

Programme

Introduction au système d'information décisionnel

  • Comprendre les principes du DM
  • Identifier les principales techniques du DM
  • Cycle de projet DM
  • Découvrir les méthodes prédictives et descriptives du DM
  • Connaître les principales étapes d'un projet DM

Introduction au DM

  • Définition du DM
  • Avantages du DM
  • Inconvénients du DM
  • La donnée (structure et cas d'usage)
  • Data Warehouse
  • DM et OLAP (Online Analytical Processing)

Data Mining Process

  • Que peut-on faire avec le DM ?
  • Types de jeux de données
  • Comment inventorier, décrire et classer les données ?
  • Comment concevoir et alimenter la base DM ?
  • Le processus de la fouille de données
    • Définition du problème
    • Collecte et préparation des données
    • Construction de modèles et évaluations
    • Déploiement des connaissances

Les outils du DM

  • Introduction aux outils d'exploration de données
  • Catégories d'outils d'exploration de données
  • Outils traditionnels d'exploration de données
  • Tableaux de bord
  • Outils d'exploration de texte
  • Autres applications et programmes

Les techniques du DM

  • Introduction aux techniques d'exploration de données
  • Réseaux de neurones artificiels
  • Arbres de décision
  • "Rule induction"
  • Algorithmes génétiques
  • Méthode du "plus proche voisin"
  • Approches de K-Means, K-Medoids et hiérarchiques
  • Avantages et inconvénients

Utilité et avenir du DM

  • Atelier et échange avec les participants

Pédagogie

L'évaluation des acquis se fait :

  • En cours de formation, par des études de cas ou des travaux pratiques
  • Et, en fin de formation, par un questionnaire d'auto-évaluation ou une certification (M2i ou éditeur)

Partager cette formationTélécharger au format pdf Ajouter à mes favoris

Formations de la même catégories (5)

M2i Formation
MapR - Architecture et administrationPar M2i Formation
  • Maîtriser l'administration des clusters MapR.
Dawan
Informix Database Initiation + ApprofondissementPar Dawan

Réaliser des schémas et requêtes quelconques sur Informix - Décrire l'architecture multi-tâches IBM Informix Dynamic Server - Installer, maintenir, administrer et optimiser un serveur IDS

Global Knowledge
Big Data : Architecture et technologiesPar Global Knowledge

Ce cours de synthèse vous présentera les enjeux et les apports du Big Data ainsi que les technologies pour sa mise en œuvre. Vous apprendrez à gérer un projet de gestion de données massives depuis l'installation d'une plateforme Big Data, tout en passant par la gestion, l'analyse et la visualisation des données.

Dawan
Apache Kafka : Echange de donnéesPar Dawan

Comprendre l’architecture de Kafka et ses cas d’utilisation - Utiliser les APIs Kafka - Administrer un cluster - Construire une architecture haute-disponibilité - Sécuriser un cluster

Orsys
Flink, développer des applications pour le Big DataPar Orsys

Apache Flink est un nouvel outil de traitement de Big Data de quatrième génération qui change le paysage des technologies de traitement des données. Ce cours vous permettra d’utiliser Apache Flink pour développer des applications en Java en vue de traiter des flux massifs de données issues du Big Data en temps réel.