Outils ETL
Talend (5 jours)
Public concerné : Développeurs
Objectifs : Savoir créer des jobs d’alimentation, etc…
Contenu :
1-Introduction à TOS
Que signifie « Intégration de données » ?
Le modèle Extract – Transform – Load (ETL)
La solution Talend Open Studio. Philosophie du produit
Installer TOS et préférences
2-Conception d’un premier programme de traitement
Modéliser le besoin avec le Business Modeler
Bonnes pratiques de conception d’un job
Les flux principaux
Les composants de traitement de sources CSV et XML
Utiliser les composants de transformation
Utiliser les composants de traitement des données
Visualiser le code généré
Exécuter le job
3-Optimisation des jobs
Importer et exporter des métadonnées
Configurer des connexions réutilisables
Créer des fichiers de configuration .ini (Perl) ou .properties (Java)
Configurer des variables
Mettre en place des méthodes de test
5-Récupération et utilisation de bases de données
Utiliser les composants principaux (tAccessInput/Output…)
Paramétrer les actions et interactions avec les tables
Utiliser les outils de requêtes
Utiliser l’éditeur de requêtes SQL Builder
6-Travail avec des données multi-sources
Rediriger des données mono-source ou multi-source avec tMap ?
Configurer et mettre en relation des flux d’entrée
Transformer les données (variables, jointures, expressions…)
Qualifier les données grâce aux filtres
7-Gestion des itérations, logs et erreurs
Boucler les jobs avec tLoop et tInfiniteLoop
Récupération de données e-mails avec tPOP
Récupérer un ensemble de fichiers/dossiers avec tFileList
Gérer les composants de log et d’erreurs (tDie, tWarn et tLogCatcher)
8-Gestion des sorties
Générer des sorties
Gérer les rejets
9-Fonctions avancées
Créer et gérer les variables contextuelles
Décomposer le job
Modes d’exécution des jobs
Initiation au débogage
Obtenir des statistiques d’exécution du job
Microsoft SSIS (5 jours)
Public concerné : Développeurs
Objectifs : Savoir créer des jobs d’alimentation, etc…
Contenu :
1-Introduction
Concepts de Datawarehouse, Datamart et ETL.
Présentation d'IS. La notion de projet SSIS.
L'outil de développement SQL Server Data Tools (SSDT).
2-Implémentation d'un flux de contrôle
Tâches de flux de contrôle. Contraintes de précédence.
Conteneurs de séquences, de boucles.
Variables, paramètres et expressions.
3-Création d'un flux de données
Sources et destinations de données (type de connexion).
Le composant "Change Data Capture".
Contrôle de la qualité, "Data Quality Services" (DQS).
4-Utilisation de package dans le chargement d'une base multidimensionnelle
Alimentation de dimensions à variations lentes (SCD).
Chargement de tables de faits.
5-Journalisation et fiabilisation d'un package
Implémentation. Utilisation du gestionnaire d'événements.
Débogage et gestion des erreurs.
Mise en place de points d'arrêts et transactions.
6-Déploiement d'une solution
Les différents types de déploiements (projet/package).
Les types de configurations de package et de déploiement.
Configuration des options d'exécution de packages.
7-Performance et suivi d'exécution
Mesurer la performance d'un package.
Le rapports de Monitoring.
Data Taps, tracer les données d'un flux.
Oracle Data Integrator (5 jours)
Public concerné : Développeurs
Objectifs : Savoir créer des jobs d’alimentation, etc…
Contenu :
Problématique de l'ETL et de l'EAI
Oracle Data Integrator
Architecture ODI
Java
JDBC (Java DataBase Connectivity)
Module
Référentiel maître
Référentiel de travail
Les agents
La démarche projet
Les KM (knowledge modules)
Rôle
La topologie
Schéma physique
Schéma logique
Contextes
Connexion aux référentiels
Designer
Modèles des données
Modèles
Sous-modèles
Reverse
Consulter / éditer les données
Journal des exécutions
Contrôle de données
Contrainte d'unicité, de référence, fonctionnelle
Statique de flux
Objets globaux
Projets
Marqueurs
Imports
Exports
Interfaces
Source, cible, filtre, KM, jointure et mapping source
Lookup
Exécution
Tables temporaires
Variables, séquences et fonctions
Traitements
Traitements et options
Les packages
Composant ODI
Faire un scénario et un package
Exécution
SAP Data Services (5 jours)
Public concerné : Développeurs
Objectifs : Savoir créer des jobs d’alimentation, etc…
Contenu :
1. Architecture générale : rôle des composants de BO Data Services 4
2. Etude de l'acquisition de données et de chaînes de processus
3. Création d’un travail en batch pour l’intégration de données
4. Recherche des erreurs dans les batchs lancés et dépannage
5. Fonctions, variables et scripts
6. Utilisation des transformations de la plateforme
7. Interception et gestion des erreurs
8. Capture des changements de données
9.Transformations via Data Integrator
Ces formations vous intéressent ?
Veuillez remplir ce formulaire et cliquez sur le bouton Envoyer.