Afges

Data science et pilotage financier

Par Afges

Objectifs

  • Comprendre les sources de création de valeur apportées par l’exploitation des données financières.
  • Savoir spécifier et prototyper les outils les plus courants de data science (KNN, random forest, régression logistique, K-mean, …) pour le pilotage financier.
  • Acquérir à votre niveau une démarche de construction d’un Minimum Viable Prototype (suivant votre maîtrise du langage Python).
  • Comprendre pour mieux encadrer les travaux d’une équipe de Data Scientists dans un projet de l’idéation à l’industrialisation.

Programme

À l’issue de la formation, les apprenants acquerront une meilleure maîtrise des outils proposés par la data science dans un contexte de pilotage financier de la banque. Sur cette question qui mobilisent beaucoup d’acteurs nouveaux ou bien établis, cette formation vise à éclairer vos pistes de réflexion et de travail, à favoriser les échanges entre professionnels de la fonction finance du secteur bancaire et à vous permettre de séparer « le bon grain de l’ivrée » dans le maquis des offres autour de la « Data ».

1. LA DATA SCIENCE : DE QUOI PARLONS-NOUS ?

  • Définition de la Data Science et positionnement par rapport à l’Intelligence Artificielle, le machine learning, le deep learning, …
  • Présentation de quelques réalisations classiques de cette discipline.
  • Les nouveaux métiers et compétences associés.
  • Les environnements de travail habituels et ceux retenus pour cette formation : Anaconda, Python, Matplotlib, Scikit-Learn.
  • Support PowerPoint.
  • Documents CIGREF et BPI sur le secteur bancaire et la révolution digitale.

2. EXEMPLE 1 DE MÉTHODE SUPERVISÉE : ALGORITHME DES K PLUS PROCHES VOISINS (KNN – K NEAREST NEIGHBOURS)

  • Principes généraux de l’algorithme.
  • Application au cas de la classification et à la régression linéaire.
  • Forces, faiblesses et principaux paramètres de réglage.
  • Exemple d’utilisation sur des données générées et sur des données d’analyse des impayés.
  • Support PowerPoint.
  • Python et données synthétiques et/ou issues de la distribution d’un produit en ligne

3. EXEMPLE 2 DE MÉTHODE SUPERVISÉE : CLASSIFIEUR DE BAYES ET RÉGRESSION LOGISTIQUE

  • Principes généraux de l’algorithme.
  • Application au cas de la classification et à la régression linéaire.
  • Forces, faiblesses et principaux paramètres de réglage.
  • Exemple d’utilisation sur des données générées et sur des données d’attrition de la clientèle (analyse du « churn rate »).
  • Support PowerPoint.
  • Python et données synthétiques et/ou issues de la distribution d’un produit en ligne.

4. EXEMPLE 3 DE MÉTHODE SUPERVISÉE : ARBRES DE DÉCISION ET FORÊT ALÉATOIRE (RANDOM FOREST)

  • Principes généraux de l’algorithme.
  • Application au cas de la classification et à la régression linéaire.
  • Forces, faiblesses et principaux paramètres de réglage.
  • Exemple d’utilisation sur des données générées et sur des données financières.
  • Support PowerPoint.
  • Python et données synthétiques et/ou issues de la distribution d’un produit en ligne.

5. LES MÉTHODES D’APPRENTISSAGE SUPERVISE : SYNTHÈSE ET MESSAGES À RETENIR

  • Éléments à retenir des algorithmes présentés.
  • Survol des autres algorithmes appartenant à cette classe de méthodes.
  • Références bibliographiques et vidéos pour aller plus loin.
  • Support PowerPoint.
  • Sites contenant des vidéos de présentation de ces techniques.

6. EXEMPLE 1 DE MÉTHODE NON-SUPERVISÉE : PARTITIONNEMENT EN K-MOYENNES (K-MEAN), CLUSTERING HIÉRARCHIQUE ET DENDOGRAMME

  • Principes généraux de l’algorithme.
  • Application au cas de la clusterisation et à la visualisation de données complexes.
  • Forces, faiblesses et principaux paramètres de réglage.
  • Exemple d’utilisation sur des données générées et sur des données financières.
  • Support PowerPoint.
  • Python et données synthétiques et/ou issues de la distribution d’un produit en ligne.

7. EXEMPLE 2 DE MÉTHODE NON-SUPERVISÉE : PARTITIONNEMENT GMM (GAUSSIAN MIXTURE MODELS), DBSCAN

  • Principes généraux de l’algorithme.
  • Application au cas de la clusterisation et à la réduction de dimension.
  • Forces, faiblesses et principaux paramètres de réglage.
  • Exemple d’utilisation sur des données générées et sur des données financières.
  • Support PowerPoint.
  • Python et données synthétiques et/ou issues de la distribution d’un produit en ligne.

8. EXEMPLE 3 DE MÉTHODE NON-SUPERVISÉE : REDUCTION DE DIMENSION PAR ANALYSE EN COMPOSANTE PRINCIPALE (PCA)

  • Principes généraux de l’algorithme.
  • Application au cas de la réduction de dimension et à la visualisation de données complexes.
  • Forces, faiblesses et principaux paramètres de réglage.
  • Exemple d’utilisation sur des données générées et sur des données financières.
  • Support PowerPoint.
  • Python et données synthétiques et/ou issues de la distribution d’un produit en ligne.

9. METTRE EN ŒUVRE CES OUTILS DANS UN MINIMUM VIABLE PROTOTYPE

  • Présentation d’une démarche globale de construction d’un prototype.
  • Techniques de réglage des hyperparamètres et de validation des modèles construits.
  • Limites et compromis à trouver à l’automatisation.
  • À propos de la visualisation des données avec python.
  • Support PowerPoint.
  • Recherches en ligne.
  • Python et données synthétiques.
  • Vidéos sur internet.

10. SYNTHÈSE ET CONCLUSION

  • Synthèse des deux journées.
  • Évaluation à chaud et sur imprimé de la formation.
  • Questions/réponses.
  • Fiches d’évaluation.

Pédagogie

  • Documentation sous PowerPoint distribuée au format pdf, fichiers au format Jupyter Notebook et données au format csv ou txt.
  • Alternance d’exercices pratiques sous Python, Jupyter Notebook, Scikit-Learn et Matplotlib.
  • Synthèses, questions/réponses pour vérifier, réviser et confirmer les acquis.
  • Si vous souhaitez réaliser les exercices dans votre contexte, votre PC sous Windows avec les outils Anaconda, Python, Jupyter Notebook installés et port USB débloqué ou accès à une messagerie pour récupérer des fichiers via Internet.
  • Vos données sous forme de tableaux au format xlsx, csv ou txt si vous souhaitez prototyper des traitements avec vos données.

Formations de la même catégories (5)

Ambient IT
TensorFlowPar Ambient IT

TensorFlow est devenu en un temps record l’un des frameworks de référence pour le Deep Learning et l’Intelligence Artificielle, utilisé aussi bien dans la recherche qu’en entreprise pour des applications en production.

Formez-vous dès maintenant au Framework IA de Référence !

Avec 25K contributeurs, Tensorflow fait partie du TOP 10 des projets les plus suivi actuellement sur GitHub et vous allez découvrir dans cette formation que ce n’est pas un hasard ! Des milliers de personnes contribuent également à ses dépendances, comme Numpy, Pytest, etc.

Découvrez comment résoudre des problèmes difficiles de Machine Learning avec la nouvelle librairie Open Source Tensorflow, le système révolutionnaire de Google d’apprentissage profond. Cette formation pratique vous montre comment construire, et quand utiliser, des architectures d’apprentissage profond. Vous apprendrez comment concevoir des systèmes capables de détecter des objets dans des images, comprendre la parole humaine, analyser la vidéo et prédire certains phénomènes. Nous aborderons ces concepts à travers des exemples pratiques afin que vous puissiez utiliser cette technologie dans vos projets Big Data. La formation AI & Deep Learning avec Tensorflow abordera les réseaux de neurones (convolutional neural networks). Vous maîtriserez également les concepts clés tels que la fonction SoftMax, les réseaux neuronaux à code automatique (Autoencoder Neural Networks), les réseaux récurrents, la machine Boltzmann restreinte (RBM, Restricted Boltzmann Machine).

Comme dans toutes nos formations, celle-ci vous présentera la toute dernière version stable de TensorFlow 2.4, sortie en Janvier 2020 couplée à Python 3.9.

ENI SERVICE
Deep Learning – Mise en oeuvre du traitement des languesPar ENI SERVICE

Cette formation présente les fondamentaux du Deep Learning appliqués au traitement du langage ainsi que les principales techniques utilisées dans l'industrie. Les travaux pratiques s'appuieront sur des données réelles et présenteront des modèles récents. Certains points aborderont des sujets de recherche récents.

Tanit Formation
Machine learning - concepts et mise en oeuvrePar Tanit Formation

Cette formation présente les fondamentaux du Machine Learning ainsi que les principales techniques utilisées dans l'industrie. Les travaux pratiques s'appuieront sur des données réelles.

Ambient IT
Atelier Découverte sur le Deep Learning avec TensorflowPar Ambient IT

Un atelier sur le Deep Learning d’une journée conçu pour les développeurs. Aucune compétence en Python ni en Machine Learning n’est nécessaire pour faire cet atelier. Venez avec votre curiosité et votre envie d’apprendre

Pendant quelques heures, vous allez coder vous-même un réseau de neurones profond pour résoudre une problématique définie d’apprentissage supervisé. Vous allez commencer par coder chaque fonction en python et vous verrez de vos propres yeux comment fonctionne le deep learning sous le capot. Dans un deuxième temps, vous allez refactoriser votre code à l’aide de TensorFlow, la librairie de machine learning la plus utilisée du monde.

Le Machine Learning est un sujet passionnant et en plein essor. Mais pour les développeurs logiciels, ce n’est pas toujours évident de trouver le temps de se lancer dans l’apprentissage de ce domaine, surtout quand on est en poste. Cet atelier a été conçu pour vous faire découvrir les réseaux de neurones profonds et vous permettre de faire vos premiers pas dans ce domaine !

Le Deep Learning est l’une des techniques les plus populaires pour faire du Machine Learning et une journée est suffisante pour acquérir des bonnes bases et vous permettre de mieux structurer votre projet d’apprentissage du vaste domaine qui est le Machine Learning et l’intelligence artificielle.

Pendant quelques heures, vous allez coder vous-même un réseau de neurones profond pour résoudre une problématique définie d’apprentissage supervisé. Vous allez commencer par coder chaque fonction en python et vous verrez de vos propres yeux comment fonctionne le deep learning sous le capot. Dans un deuxième temps, vous allez refactoriser votre code à l’aide de Tensorflow, la librairie de machine learning la plus utilisée du monde.

La plupart de développeurs logiciels tombent dans l’erreur de se spécialiser dans l’utilisation d’un outil, sans connaître le comment et le pourquoi (don’t be a tools user !). Notre objectif n’est pas de vous apprendre à utiliser un outil ou une technologie, mais plutôt de vous faire comprendre la logique derrière celle-ci. Un ingénieur ML doit pouvoir implémenter avec différentes librairies et ne pas être dépendant d’un outil en particulier.

Comme toutes nos formations, celle-ci présentera la dernière version en date de l’outil à savoir TensorFlow 2.4.

ENI SERVICE
Deep Learning – Mise en oeuvrePar ENI SERVICE

Cette formation présente les fondamentaux du Deep Learning ainsi que les principales techniques utilisées dans l'industrie. Les travaux pratiques s'appuieront sur des données réelles et présenteront des modèles récents. Certains points aborderont des sujets de recherche récents.