+33 (0)1 53 89 99 93 info@xebia-training.fr

Data

Certification Hadoop administrateurs de Cloudera (CCAH Cloudera Certified Administrator)

Avec Julien Buret
4 jours, soit 28 heures
Cette formation de 4 jours permettra aux Administateurs Système ou autres responsables Ops de gèrer des clusters d’Apache Hadoop dans des environnements de production ou des environnements Dev.

Cette formation donne accés à la certification « Certified Administrator for Apache Hadoop (CCAH)» de Cloudera.

Programme

Une introduction à Hadoop et HDFS
  • Pourquoi Hadoop
  • HDFS
  • MapReduce
  • Hive, Pig, HBase, et d’autres écosystèmes projet
  • Exercices pratiques
Planifier son cluster Hadoop
  • Choisir le bon matériel
  • Réseau
  • « Configuring Nodes »
Configurer et déployer un Cluster
  • Types de déploiement
  • Installer Hadoop
  • Utiliser “Cloudera Manager for Easy Installation”
  • Les paramètres de configuration typiques
  • Utiliser “Configuration Management Tools”
  • Exercices pratiques
Gérer les tâches
  • Gérer les tâches en cours
  • Exercices pratiques
  • Le “FIFO Scheduler”
  • Le “FairScheduler”
  • Exercices pratiques
Gestion de Cluster
  • HDFS
  • Exercices pratiques : copier des données entre clusters
  • Rajouter et retirer des « Cluster Nodes »
  • Rééquilibrer un Cluster
  • Exercices pratiques : Optimiser un Cluster
Cluster Monitoring et Troubleshooting
  • Gérer les “Log files” d’Hadoop
  • Utiliser le “NameNode” et “Job Tracker Web UI”
  • Exercices pratiques
  • Gestion de Cluster avec Ganglia
  • Troubleshooting
  • Benchmarking un Cluster
Conclusion de la formation Hadoop Administrateurs
  • Cloudera Certified Administrator for Apache Hadoop Exam

Objectifs

Les stagiaires, à l’issue de la formation sauront :

  • Reposer les bases de l’environnement Hadoop et HDFS
  • Poser les bases de Hadoop Cluster : choix du matériel, « configuring nodes »
  • Configurer, déployer et gérer des Clusters : utiliser “Cloudera Manager for Easy Installation”, “Configuration Management Tools” et Ganglia
  • Rajouter et retirer des « Cluster Nodes », rééquilibrer un Cluster et optimiser un Cluster
  • Gérer des tâches : Le “FIFO Scheduler”, Le “FairScheduler”
  • Gérer les “Log files” d’Hadoop
  • Utiliser le “NameNode” et “Job Tracker Web UI”
  • Troubleshooting
  • Savoir « Benchmarking » un Cluster

Méthodes pédagogiques

50% de travaux pratiques sur les 4 jours de formation.

Les participants apprendront l’administration d’un cluster Apache Hadoop au travers d’échanges avec le formateur ainsi qu’en réalisant des exercices pratiques sur les sujets suivants :

  • Comment les données sont distribuées, stockées et enregistrées dans un cluster Hadoop ?
  • Comment les ressources sont gérées dans un cluster Hadoop en « multi-tenancy » ?
  • Comment dimensionner un cluster Hadoop ?
  • Comment installer et bien configurer un cluster Hadoop ?
  • Comment utiliser les outils d’administration fournis par Cloudera ?
  • Quelles sont les différentes métriques à monitorer dans un cluster Hadoop ?
  • Quelles sont les tâches d’exploitation à réaliser dans un cluster Hadoop ?
  • Comment importer des données dans un cluster Hadoop ?
  • Comment requêter les données présentes dans le cluster au travers d’Impala et de Hive
  • Quels impacts ont ces outils sur le dimensionnement du cluster ?
  • Comment sécuriser au mieux son cluster ?

Tarif HT

Inter : 2 995 €

Intra : Selon demande

Prochaines dates de formation

26 – 29 mars

28 – 31 mai

28 – 31 août

6 – 9 octobre

Biographie

Julien Buret

Julien Buret est le co-fondateur et CTO de Zeenea, le data catalog des entreprises data-driven.
Ex-CTO de Xebia, Julien a acquis une vaste expérience dans l’écosystème Java EE et Big Data. Il est intervenu principalement dans la mise en place de solutions Big Data auprès des grands comptes dans les télécoms, la finance, les jeux en ligne, etc.
Julien est également un formateur Hadoop certifié par Cloudera depuis 2012. Il a été nommé formateur européen de l’année 2014 par Cloudera. Julien anime régulièrement des ateliers techniques autour de thématiques liées au Big Data. Il fut également le vainqueur du Chalenge USI 2011 (développement d’une application web scalable pour plusieurs millions d’utilisateurs).

Public visé

Cette formation de 4 jours s’adresse aux administrateurs systèmes et aux personnes qui gèrent et maintiennent les clusters Apache Hadoop en production ou qui évoluent dans un environnement de développement.

Prérequis

Il est utile d’avoir une expérience dans l’administration système Linux. Aucune expérience avec Hadoop n’est nécessaire.
Les postes de travail et les logiciels nécessaires au bon déroulement de la formation sont fournis par Xebia.

Certification

À la suite de la formation, les stagiaires auront la possibilité de passer l’examen « CCAH Cloudera Certified Administrator ». Cet examen se déroule en dehors du temps de la formation. Ils deviendront alors des Administrateurs Hadoop certifiés Cloudera dans leur entreprise.

Validation

À la fin de cette formation, les stagiaires recevront une attestation de présence.

SOFTWARE TRAINING DONE RIGHT