Suivez nous

Appelez-nous vite au 01 84 24 01 82

Menu

Formation précédente

Formation suivante

Toutes nos formations en Base de données :

Hadoop : développement

CONNAISSANCES PREALABLES

Connaissance d'un langage de programmation objet comme Java

DURÉE

3 jours (21 heures)

PROFIL DES STAGIAIRES

Chefs de projets, développeurs, data-scientists, et toute personne souhaitant comprendre les techniques de développement avec MapReduce dans l'environnement Hadoop

OBJECTIFS

Connaître les principes du framework Hadoop et savoir utiliser la technologie MapReduce pour paralléliser des calculs sur des volumes importants de données

METHODES PEDAGOGIQUES

Mise à disposition d’un poste de travail par participant
Remise d’une documentation pédagogique papier ou numérique pendant le stage
La formation est constituée d’apports théoriques, d’exercices pratiques et de réflexions

METHODES D'EVALUATION DES ACQUIS

Auto-évaluation des acquis par le stagiaire via un questionnaire
Attestation de fin de stage adressée avec la facture

FORMATEUR

Consultant-Formateur expert Bigdata

CONTENU DU COURS

1 - Introduction

Les fonctionnalités du framework Hadoop
Le projet et les modules : Hadoop Common, HDFS, YARN, Spark, MapReduce
Utilisation de yarn pour piloter les jobs mapreduce

2 - MapReduce

Principe et objectifs du modèle de programmation MapReduce
Implémentation par le framework Hadoop
Etude de la collection d’exemples
Travaux pratiques : Rédaction d’un premier programme et exécution avec Hadoop

3 - Programmation

Configuration des jobs, notion de configuration
Les interfaces principales : mapper, reducer
La chaîne de production : entrées, input splits, mapper, combiner, shuffle/sort, reducer, sortie, partitioner, outputcollector, codecs, compresseurs..
Format des entrées et sorties d’un job MapReduce : InputFormat et OutputFormat
Travaux pratiques : type personnalisés : création d’un writable spécifique. Utilisation. Contraintes

4 - Outils complémentaires

Mise en oeuvre du cache distribué
Paramétrage d’un job : ToolRunner, transmission de propriétés.
Accès à des systèmes externes : S3, hdfs, har, …
Travaux pratiques : répartition du job sur la ferme au travers de yarn

5 - Streaming

Définition du streaming map/reduce
Création d’un job map/reduce en python
Répartition sur la ferme. Avantage et inconvénients
Liaisons avec des systèmes externes
Introduction au pont HadoopR
Travaux pratiques : suivi d’un job en streaming

6 - Pig

Présentation des pattern et best practices Map/reduce
Introduction à Pig
Caractéristiques du langage : latin
Travaux pratiques : installation/lancement de pig
Ecriture de scripts simples pig. Les fonctions de base
Ajouts de fonctions personnalisées. Les UDF. Mise en oeuvre

7 - Hive

Simplification du requêtage. Etude de la syntaxe de base
Travaux pratiques : Création de tables. Ecriture de requêtes. Comparaison pig/hive

8 - Sécurité en environnement Hadoop

Mécanisme de gestion de l’authentification
Travaux pratiques : configuration des ACLs

Formation inter

à partir de

1843 €

par stagiaire

Besoin d'aide >

Un renseignement ?
Un devis ?

Nos
références

Suivez-nous

Contact & renseignements

info-formations@trouvezvotreformation.com

67, Rue de Paris
95720 Le Mesnil Aubry