+33 (0)1 53 89 99 93 info@xebia-training.fr

Depuis le 15 novembre 2018, Xebia a rejoint Publicis Sapient, leader de la Digital Business Transformation.

Data Engineering

Certification Hadoop administrateurs de Cloudera (CCAH Cloudera Certified Administrator)

Avec Sylvain Lequeux
4 jours, soit 28 heures
Cette formation de 4 jours permettra aux Administateurs Système ou autres responsables Ops de gèrer des clusters d’Apache Hadoop dans des environnements de production ou des environnements Dev.

Cette formation donne accés à la certification « Certified Administrator for Apache Hadoop (CCAH)» de Cloudera.

Programme

Une introduction à Hadoop et HDFS
  • Pourquoi Hadoop
  • HDFS
  • MapReduce
  • Hive, Pig, HBase, et d’autres écosystèmes projet
  • Exercices pratiques
Planifier son cluster Hadoop
  • Choisir le bon matériel
  • Réseau
  • « Configuring Nodes »
Configurer et déployer un Cluster
  • Types de déploiement
  • Installer Hadoop
  • Utiliser “Cloudera Manager for Easy Installation”
  • Les paramètres de configuration typiques
  • Utiliser “Configuration Management Tools”
  • Exercices pratiques
Gérer les tâches
  • Gérer les tâches en cours
  • Exercices pratiques
  • Le “FIFO Scheduler”
  • Le “FairScheduler”
  • Exercices pratiques
Gestion de Cluster
  • HDFS
  • Exercices pratiques : copier des données entre clusters
  • Rajouter et retirer des « Cluster Nodes »
  • Rééquilibrer un Cluster
  • Exercices pratiques : Optimiser un Cluster
Cluster Monitoring et Troubleshooting
  • Gérer les “Log files” d’Hadoop
  • Utiliser le “NameNode” et “Job Tracker Web UI”
  • Exercices pratiques
  • Gestion de Cluster avec Ganglia
  • Troubleshooting
  • Benchmarking un Cluster
Conclusion de la formation Hadoop Administrateurs
  • Cloudera Certified Administrator for Apache Hadoop Exam

Objectifs

Les stagiaires, à l’issue de la formation sauront :

  • Reposer les bases de l’environnement Hadoop et HDFS
  • Poser les bases de Hadoop Cluster : choix du matériel, « configuring nodes »
  • Configurer, déployer et gérer des Clusters : utiliser “Cloudera Manager for Easy Installation”, “Configuration Management Tools” et Ganglia
  • Rajouter et retirer des « Cluster Nodes », rééquilibrer un Cluster et optimiser un Cluster
  • Gérer des tâches : Le “FIFO Scheduler”, Le “FairScheduler”
  • Gérer les “Log files” d’Hadoop
  • Utiliser le “NameNode” et “Job Tracker Web UI”
  • Troubleshooting
  • Savoir « Benchmarking » un Cluster

Méthodes pédagogiques

50% de travaux pratiques sur les 4 jours de formation.

Les participants apprendront l’administration d’un cluster Apache Hadoop au travers d’échanges avec le formateur ainsi qu’en réalisant des exercices pratiques sur les sujets suivants :

  • Comment les données sont distribuées, stockées et enregistrées dans un cluster Hadoop ?
  • Comment les ressources sont gérées dans un cluster Hadoop en « multi-tenancy » ?
  • Comment dimensionner un cluster Hadoop ?
  • Comment installer et bien configurer un cluster Hadoop ?
  • Comment utiliser les outils d’administration fournis par Cloudera ?
  • Quelles sont les différentes métriques à monitorer dans un cluster Hadoop ?
  • Quelles sont les tâches d’exploitation à réaliser dans un cluster Hadoop ?
  • Comment importer des données dans un cluster Hadoop ?
  • Comment requêter les données présentes dans le cluster au travers d’Impala et de Hive
  • Quels impacts ont ces outils sur le dimensionnement du cluster ?
  • Comment sécuriser au mieux son cluster ?

Tarif HT

Inter : 2 995 €

Intra : Selon demande

Prochaines dates de formation

11-14 mars (2019)

21-24 mai (2019)

20-23 août (2019)

25-28 novembre (2019)

Biographie

Sylvain Lequeux

Sylvain est Data Engineer chez Xebia. Il dispense la formation certifiante Cloudera Administrateur et la formation Machine Learning avec Spark. Sylvain est également passionné par le craftsmanship.

Public visé

Cette formation de 4 jours s’adresse aux administrateurs systèmes et aux personnes qui gèrent et maintiennent les clusters Apache Hadoop en production ou qui évoluent dans un environnement de développement.

Prérequis

Il est utile d’avoir une expérience dans l’administration système Linux. Aucune expérience avec Hadoop n’est nécessaire.
Les postes de travail et les logiciels nécessaires au bon déroulement de la formation sont fournis par Xebia.

Certification

À la suite de la formation, les stagiaires auront la possibilité de passer l’examen « CCAH Cloudera Certified Administrator ». Cet examen se déroule en dehors du temps de la formation. Ils deviendront alors des Administrateurs Hadoop certifiés Cloudera dans leur entreprise.

Validation

À la fin de cette formation, les stagiaires recevront une attestation de présence.

SOFTWARE TRAINING DONE RIGHT