Formations Bases de données et big data

Page 61 sur 65
ENI SERVICE
Machine Learning et Deep Learning – Vue d’ensemble des enjeux de l’Intelligence ArtificiellePar ENI SERVICE

Séminaire de présentation des enjeux et tendances de l'Intelligence Artificielle.

Le Pont Learning
Certification Hadoop avec Spark pour Développeurs de ClouderaPar Le Pont Learning

Cette formation Certification Spark avec Hadoop pour Développeurs de Cloudera vous permettra de :

  • Comment les données sont distribuées, stockées et enregistrées dans un cluster Hadoop ?
  • Comment utiliser Sqoop et Flume pour intégrer les données ?
  • Comment enregistrer des données distribuées avec Apache Spark ?
  • Comment modéliser des données structurées en tant que tableau dans Impala et Hive ?
  • Comment choisir le meilleur format de stockage de données pour différents patterns d'utilisation de données ?
  • Les meilleures pratiques pour le stockage de données.
Ambient IT
Pandas et Jupyter NotebookPar Ambient IT

Pandas est un librairie python qui permet d’importer les données rapidement. Il permet aussi de réaliser des analyses de la donnée rapidement et facilement, et fournit une abstraction haut niveau de la manipulation de matrices. Pandas manipuler tout type de données, quelle soit textuelle, temporelles ou numérique. Aucun code n’est requis, ce qui permet de se concentrer sur le fonctionnel.

Jupyter Notebook est un outils de reporting visuel qui présente de nombreux avantages. Il vous permet de créer et de partager des documents contenant du code en direct, des équations, des visualisations et du texte narratif. Les utilisations incluent : le nettoyage et la transformation de données, la simulation numérique, la modélisation statistique, la visualisation de données, l’apprentissage automatique, etc.

Dans cette formation, nous verrons comme importer et exploiter de la donnée avec Pandas sur Jupyter. Nous apprendrons ensuite à manipuler cette donnée. A la fin de cette formation, vous serez capable de réaliser un rapport complet.

Comme toutes nos formations, celle-ci vous présentera la dernière version stable en date et ses nouveautés (Pandas 1.3 et Jupyter 6.4 à la date de l’article).

IB Formation
Big Data - L'écosystème centralisé de streaming avec Apache KafkaPar IB Formation
  • Être capable de comprendre le fonctionnement de Kafka
  • Acquérir les bonnes pratiques de distribution de messages
  • Savoir configurer Kafka pour intégrer les données de différents formats et de sources différentes
Dawan
Programmer Hadoop en JavaPar Dawan
  • Développer des algorithmes parallèles efficaces - Analyser des fichiers non structurés et développer des tâches Java MapReduce - Charger et récupérer des données de HBase et du système de fichiers distribué Hadoop (HDFS) - User Defined Functions de Hive et Pig
SQLI Institut
Big Data - Mise en oeuvre pratique d'une solution complète d'analyse des donnéesPar SQLI Institut
  • Disposer des compétences techniques nécessaires à la mise en oeuvre d'analyses Big Data
  • Comprendre le cadre juridique du stockage et de l'analyse de données
  • Savoir utiliser des outils de collecte opensource
  • Être en mesure de choisir la bonne solution de stockage de données au regard des spécificités d'un projet (OLAP, NoSQL, graph)
  • Explorer la boite à outils technologique que constitue Hadoop et son écosystème et savoir comment utiliser chaque brique (MapReduce, HIVE, SPARK,...)
ENI SERVICE
MongoDB pour les développeurs JavaPar ENI SERVICE

Comment intégrer une base de données NoSQL à vos projet Java ? Après avoir exploré le fonctionnement d’une base de données NoSQL, vous découvrirez comment utiliser les drivers mongo pour Java et mettre en oeuvre les frameworks de mapping Object-Document.

Global Knowledge
DB2 SQL Workshop for Experienced UsersPar Global Knowledge

La formation de 3 jours "IBM DB2 : Atelier SQL pour les utilisateurs expérimentés" apprend à utiliser des techniques avancées de SQL pour accéder à des bases de données DB2 dans différents environnements.

Ce cours est destiné aux professionnels qui travaillent dans tous les environnements DB2, en particulier pour OS/390, z/OS, VM/VSE, iSeries, Linux, UNIX et Windows.

La dernière version de ce cours présente IBM Data Studio et est basée sur un environnement Microsoft Windows 7.

Ce contenu est lié à l'ERC 9.5.

Dawan
Optimisations des performances d'une application / JMeterPar Dawan

Comprendre la mise en place de tests de performance et acquérir de bonnes pratiques d'optimisation d'applications

Arkesys
Analyses multivariées, classification (ACP, AFC, ACM, CAH, k-means, AFD)Par Arkesys

La formation en quelques mots

Cette formation s'adresse à des personnes souhaitant maîtriser les concepts et la mise en œuvre des analyses factorielles multivariées. Ces analyses ont pour objectif d’extraire des informations de données

La formation conviendra tout à fait à un public venant chercher du savoir statistique sur :

Thèmes principaux

Jeux de données

Afin de s'approcher au mieux des réalités quotidiennes des praticiens, nous suggérons de nous appuyer pour l'animation pratique de thématiques et surtout de jeux de données reflétant le quotidien des apprenants.
Cet élément est un facteur de réussite pour la formation. Elle permet aux apprenants de :

Il sera donc pertinent que les apprenants puissent réfléchir en amont de la formation à des problématiques, jeux de données ou documents susceptibles d’être utilisés en support lors de la formation.

Outil logiciel

Cette formation n’est pas strictement dédiée à un logiciel. Les exercices et les illustrations se feront à l'aide d'un logiciel "spécialisé" pour ce type d'analyses : XlStat, R, Jmp, ... Le logiciel retenu sera choisi en accord avec celui utilisé par le plus grand nombre des stagiaires.