Formations InfoSphere

Page 1 sur 4Voir tout le catalogue
Global Knowledge
IBM InfoSphere DataStage v11.5 - Traitements Avancés des DonnéesPar Global Knowledge

Ce cours de 2 jours est conçu pour présenter les traitements de données liés à des travaux parallèles avancés avec DataStage v11.5.

Dans ce cours, vous découvrirez les techniques pour gérer différents types de données complexes y compris les données relationnelles, les données non structurées (feuilles de calcul Excel) et des données XML.

De plus, vous apprendrez les techniques avancées pour traiter les données, y compris les techniques pour masquer des données et les techniques pour valider des données en utilisant des règles de gestion des données. Enfin, vous apprendrez les techniques pour mettre à jour les données dans un schéma en étoile d'un entrepôt de données en utilisant les étapes du SCD (Slowly Changing Dimensions) de DataStage. Même si vous ne travaillez pas avec tous les types de données spécifiées, vous pourrez bénéficier de ce cours en apprendant les techniques avancées de conception de DataStage, des techniques qui vont au-delà de celles qui sont utilisées dans le cadre de la formation KM204G : IBM InfoSphere DataStage Essentials V11.5.

Ce contenu est lié à l'ERC 1.0.

Global Knowledge
InfoSphere MDM Virtual Foundation v11.4Par Global Knowledge

This course is designed as the starting point for any technical specialist working with the InfoSphere MDM Virtual module. This course walks you through the major components of the InfoSphere MDM Virtual module, the data model, the matching engine and how customization can be implementated. You will learn how to invoke the InfoSphere MDM interactions and the various configuration and extension points of a service. The course is also used as an intro to various compoments that make up the MDM Architecture and prepares you to identify how the MDM will fit into their organization and what pieces may be customize to fit their business requirements.

Global Knowledge
IBM InfoSphere Advanced DataStage - Parallel Framework v11.5Par Global Knowledge

IBM InfoSphere DataStage intègre des données sur de multiples systèmes en utilisant une structure parallèle à haute performance et prend en charge la gestion étendue des métadonnées et la connectivité d'entreprise.

Cette formation vise à introduire les techniques de développement de jobs parallèles avancés dans IBM DataStage. Les participants renforcent leur compréhension de l’architecture de DataStage, y compris du développement de DataStage et des environnements d’exécution. Ils sont ainsi en mesure de concevoir des travaux parallèles robustes, moins sujets à des erreurs, réutilisables, et optimisés pour de meilleures performances.

Global Knowledge
InfoSphere BigMatch for Hadoop (v11.4)Par Global Knowledge

Ce cours de 2 jours fait découvrir InfoSphere Big Match et sa technologie – Probabilistic Matching Engine (PME).

Les participants apprendront comment Big Match peut être utilisé pour résoudre et découvrir des entités à travers plusieurs jeux de données dans Apache Hadoop. Ils découvriront ausi les bases d'un algorythme PME, y compris la configuration du modèle de données, la standardisation, la comparaison et les fonctions de décompactage (bucketing), la génération de poids et les limites.

Pendant les démonstrations et les exercices, les participants travailleront sur un cas pratique, dans lequel ils appliqueront leur connaissance de Big Match pour découvrir les relations entre deux jeux de données.

Global Knowledge
InfoSphere MDM Domain v11.4Par Global Knowledge

This course is designed for anyone who wants to get an understanding of the Data Domains for the InfoSphere Master Data Management Physical Module. This course takes a comprehensive look at the three core data domains of InfoSphere MDM: Party, Account, and Product. For each of the domains spanned by InfoSphere MDM, participants will be exposed to the data model, services, and rules associated with the main entities of that domain. Heavy emphasis is put on exercises and activities so that the participants can apply the knowledge that they learn after course conclusion.

M2i Formation
IBM InfoSphere DataStage - Essentials 11.5Par M2i Formation
  • Décrire l'utilisation de DataStage et du workflow DataStage
  • Comprendre l'architecture Information Server et comment DataStage s'y intègre
  • Connaître les options de déploiement de Information Server et DataStage
  • Utiliser la console Web de Information Server et le client d'administration DataStage pour créer les utilisateurs et configurer l'environnement DataStage
  • Importer et exporter les objets DataStage dans un fichier
  • Importer des définitions de tables pour des fichiers séquentiels et des tables relationnelles
  • Concevoir, compiler, activer et surveiller des travaux parallèles dans DataStage
  • Concevoir des travaux qui lisent et écrivent des fichiers séquentiels
  • Décrire l'architecture de traitement parallèle de DataStage
  • Concevoir les travaux qui combinent des données avec des jointures et des recherches
  • Concevoir des travaux qui trient et rassemblent les données
  • Mettre en oeuvre un business logique complexe avec DataStage Transformer
  • Debogger les tâches DataStage avec DataStage PX Debugger.
Global Knowledge
BigInsights Analytics pour les ProgrammeursPar Global Knowledge

Ce cours est conçu pour aider les programmeurs qui travaillent avec IBM InfoSphere BigInsights. Écrire des programmes qui extraient les données de texte non structuré peut être une tâche difficile. Vous apprendrez comment créer des annotateurs grâce à l'utilisation d'Annotation Query Language (AQL) d'IBM. L'analyse des données en utilisant Apache Hadoop nécessite normalement d'écrire des programmes MapReduce. Vous apprendrez comment utiliser Jaql pour créer des programmes de haut niveau qui sont décomposés en programmes Hadoop MapReduce.

Les personnes familières avec la technologie Hadoop sont conscients des autres produits open source qui sont utilisés dans cet environnement. Ce cours vous donne les bases pour programmer en utilisant le langage Apage Pig. Il y a aussi une vue d'ensemble de ZooKeeper, HBase et Hive. Une des capacités de la console Web BigInsights est la capacité à simplifier l'invocation d'applications Hadoop. Ce cours montre comment publier une application d'analyse de texte à partir d'un environnement de développement BigInsights vers un serveur BigInsights.

Global Knowledge
IBM InfoSphere IGC II v11.5.0.2 : Créer le Catalogue de GouvernancePar Global Knowledge

Dans ce cours d'une journée, les participants apprendront comment Information Governance Catalog (IGC) fournit un ensemble de propriétés standard pour les règles de gouvernance de l'information. Ce catalogue documente les actifs informationnels, les règles de gouvernance et les règles qui implémentent la stratégie à haut-niveau et les objectifs d'un programme de gouvernance.

Ce cours adresse des fonctionnalités qui étaient présentes dans le logiciel Business Glossary.

Global Knowledge
IBM InfoSphere QualityStage Essentials v11.5Par Global Knowledge

Ce cours vous apprend comment créer des parallel jobs avec QualityStage pour étudier, normaliser, faire correspondre et consolider les enregistrements de données.

Les participants développeront leur expérience en construisant une application qui combine des données clients à partir de 3 sources systèmes différentes dans un seul enregistrement client principal.

Formation éligible au Compte Personnel de Formation (CPF), permettant de préparer la Certification associée inscrite à l'inventaire de la CNCP. Attention, différents codes CPF existent selon le secteur métier de l'entreprise. Nous consulter.