M2i Formation

Data Science avec Python (Scikitlearn)

Par M2i Formation

Objectifs

  • Utiliser Scikitlearn pour créer des modèles d'apprentissage machine
  • Concevoir des expériences et interpréter les résultats des tests A/B
  • Visualiser l'analyse de clustering et de régression en Python à l'aide de Matplotlib
  • Produire des recommandations automatisées de produit ou de contenu avec des techniques de filtrage collaboratif
  • Appliquer les meilleures pratiques en matière de nettoyage et de préparation de vos données avant l'analyse.

Programme

Jour 1

Introduction à la Data Science (la science des données)

  • Qu'est-ce que la Data Science ?
    • Définition
    • Différence entre statistiques et Data Science
    • Champs d'application de la Data Science
    • Outils et algorithmes pour faire de la Data Science
  • Les méthodes de Machine Learning (apprentissage automatique)
    • L'apprentissage supervisé
    • L'apprentissage non supervisé
    • L'apprentissage renforcé

Le langage de programmation Python - Bases

  • Introduction à Python
  • Les structures / propriétés / fonctions spéciales
  • La Programmation Orientée Objet (POO)
  • La bibliothèque standard

Le langage de programmation Python - Avancé

  • Notions avancées de Python
  • Respecter de bonnes pratiques de développement
  • Manipuler les librairies NumPy, SciPy, Pandas et Matplotlib

Préparation de données pour la Data Science

  • Pourquoi la préparation des données est-elle si importante en Data Science ?
  • Étapes de préparation des données (du nettoyage des données à la compréhension des données)

Jour 2

Exemples de travaux pratiques sur Scikitlearn (à titre indicatif)

  • Maîtriser les techniques d'apprentissage automatique et d'exploration de données avec Scikitlearn de Python
    • Extraction de caractéristiques et prétraitement
    • Réduction de la dimensionnalité avec l'Analyse des Composants Principaux (PCA)
    • Analyse de régression linéaire, multi-linéaire, polynomiale, logistique et régularisation
    • Classification supervisée
    • Classification non supervisée et régression avec arbres de décision
    • K-means clustering
    • Perceptron et le Support des Machines Vectorielles (SVM)
    • Réseaux de neurones artificiels

Jour 3

Exemples de travaux pratiques sur Scikitlearn (à titre indicatif) - Suite

  • Maîtriser les techniques d'apprentissage automatique et d'exploration de données avec MLlib d'Apache Spark
    • Analyse en composantes principales
    • Analyse de régression
    • K-means clustering
    • Train / Test et validation croisée
    • Méthodes bayésiennes
    • Arbres de décision et forêts aléatoires
    • Régression multivariée
    • Modèles multiniveaux
    • Support des Machines Vectorielles (SVM)
    • Apprentissage par renforcement
    • Filtrage collaboratif
    • K plus proche voisin
    • Le compromis biais / variance
    • Apprentissage d'ensemble
    • Fréquence de terme / Fréquence inverse de documents
    • Conception expérimentale et A/B testing

Cas d'usage particuliers de Data Science

  • Algorithmes de classification / supervisés et non supervisés
    • Classification des itinéraires / chemins (basée sur les matrices origines / destinations temporelles)
    • Détection de mode de transport ou forme de mobilité à partir de jeux de données images
  • Algorithmes de recommandation
    • Filtrage collaboratif pour les recommandations : basé sur le contenu, les éléments, l'utilisateur ou filtrage hybride
  • Clustering pour les recommandations
  • Deep Learning pour les recommandations

Pédagogie

L'évaluation des acquis se fait :

  • En cours de formation, par des études de cas ou des travaux pratiques
  • Et, en fin de formation, par un questionnaire d'auto-évaluation ou une certification (M2i ou éditeur)

Partager cette formationTélécharger au format pdf Ajouter à mes favoris

Formations de la même catégories (5)

Open Source School Executive Education
Python des bases à la maîtrisePar Open Source School Executive Education

Cette formation a pour objectifs de vous permettre de maîtriser les aspects essentiels du langage Python et de son écosystème, afin de vous permettre d'appréhender de façon autonome la réalisation d'applications ambitieuses dans les domaines de votre métier.

Global Knowledge
Le langage Python pour Machine LearningPar Global Knowledge

La Data Science nécessite des compétences spécifiques afin de prévoir le comportement des clients ou d’anticiper des tendances.
Cette formation vous permettra de découvrir l’analyse de données ainsi que le Machine Learning via Python, les différentes étapes qui interviennent lors de l’élaboration d’un modèle statistique, ainsi que l’analyse textuelle et la Data Visualisation.

Data Value
Python pour la Data SciencePar Data Value

Connaître et savoir utiliser les librairies incontournables de Python pour la data science : La Scipy Stack
Connaître et utiliser les principales librairies de visualisation de données et notamment orientées cartographie
Savoir manipuler des données volumineuses ne tenant pas en mémoire
Avoir une bonne compréhension de l'écosystème scientifique de Python, savoir trouver ses librairies et juger de leur qualité

Arkesys
Python - Perfectionnement : Programmation orientée objet, interface graphiquePar Arkesys

La formation en quelques mots

Python est un langage devenu populaire en raison de la simplicité d’écriture et de mise en œuvre des analyses et des programmes, de son accessibilité (environnement open-source), et de son champ d’application complet grâce aux nombreuses librairies qui disposent de fonctions relatives à plusieurs domaines comme la Data Science, la Data Visualisation, le calcul scientifique. Ce langage permet de développer des applications variées.
La formation a pour objectif de permettre aux personnes ayant des bases en programmation d’approfondir les différentes notions de bases du langage Python, d’apprendre comment créer et implémenter des interfaces graphiques, tester et gérer un programme. La formation abordera également les différents outils Python qui permettent la manipulation de fichiers, de modules et de bibliothèques.

Thèmes principaux

Retengr
Langage Python – Développez en Python 3Par Retengr

Poussé par l’apparition de librairies dédiées à la Datascience, le langage Python connait depuis quelques années un vif regain d’intérêt. Longtemps considéré comme un simple langage, Python s’est enrichi de fonctionnalités beaucoup moins évidentes à mettre en œuvre et qui composent toute sa puissance. Cette formation ne traite pas de Data Science, ce sujet est traité dans notre formation « Pensez comme un Data Scientist ».

Nous utilisons les cookies afin de fournir les services et fonctionnalités proposés sur notre site et afin d’améliorer l’expérience de nos utilisateurs. En cliquant sur ”J’ai compris”, vous acceptez l’utilisation de ces cookies.