Ferme la recherche

Analyse de données en environnement Hadoop

Descriptif

Durée de la formation

Durée 21 heures
En centre 21 heures

Session

du 06 avril 2020 au 08 avril 2020  - Paris - 5ème (75)
+ autres sessions
du 06 avril 2020 au 08 avril 2020  - Paris - 5ème (75)
du 29 juin 2020 au 01 juil. 2020  - Paris - 5ème (75)
du 30 nov. 2020 au 02 déc. 2020  - Paris - 5ème (75)

Objectif de la formation

Comprendre ce que sont Hadoop et YARN
Connaître les différents outils et les Framework dans un environnement Hadoop 2.0
Appréhender MapReduce
Comprendre comment exécuter une tâche de MapReduce sur YARN
Exécuter des modifications en masse avec PIG
Savoir écrire des requêtes pour HIVE afin d'analyser ses données
Savoir utiliser Sqoop pour transférer les données entre Hadoop et une base de données relationnelle
Découverte d'autres briques : automatiser vos process avec Oozie
Utiliser une base de données No
- SQL (HBase)

Description de la formation

- 1ère partie
Comprendre Hadoop 2.0 et son écosystème
Quels impacts de l'arrivée d'Hadoop dans un SI traditionnel ?
Le Hadoop Distributed File System (HDFS)
Introduction aux données dans HDFS
MapReduce Framework et YARN
- 2ème partie
Introduction à Pig
Programmation Pig avancée
Troubleshooting et optimisation avec Pig
Résolution des problèmes avec Pig
Utiliser l'UI Web d'Hadoop
Démo optionnelle : résolution d'un Failed Job avec l'UI Web
Echantillonnage de données et débogage
Vue d'ensemble des performances
Comprendre le plan d'exécution
Astuces pour améliorer la performance de vos Pig Jobs
- 3ème partie
Programmation Hive
Utilisation de HCatalog
Programmation Hive avancée
Etendre Hive
Transformation de données avec des Scripts personnalisés
Fonctions définies par l'utilisateur
Paramétrer les requêtes
Exercices Hands
- On : transformation de données avec Hive
Programmation Hive avancée (suite)
Analyse de données et statistiques
- 4ème partie
Import/Export avec Sqoop (SGBDR HDFS)
Sqoop, fonctions avancées
Définition de workflow avec Oozie
- Optionnel : (sous réserve de temps)
Introduction à H
- Base
Exemple d'ingestion de données avec l'ETL Talend
Créer son propre cluster Hadoop (plateforme de test)

Conditions d'accès

Aucun.

Validation

Attestation d'acquis ou de compétences;Attestation de suivi de présence

Donne accès au(x) métier(s) suivant(s)

Etudes et prospectives socio-economiques (voir la fiche métier)

Et après la formation ?

Retour à l'emploi des anciens stagiaires

ÉLEVÉ

Conseils
Les questions à poser avant de choisir un centre de formation
  • Quels sont les profils des anciens stagiaires (niveau de formation, expérience professionnelle) ?
  • Est-il possible de visiter le centre ?
  • Quel type de public accueillez-vous en formation (salariés, demandeurs d’emploi, particuliers) ?
  • Peut-on obtenir une liste de ces anciens stagiaires pour les interroger sur cette formation ?
  • Comment aidez-vous les stagiaires à trouver un emploi ?

Data Value

Lieu de formation

Le Bloc
10 bis Rue du Sommerard
Paris - 5ème

Calculez votre itinéraire

Centre de formation

Data Value
41 Rue de la Découverte
31670, Labège

Toutes les formations et avis pour Data Value