+33 (0)1 53 89 99 93 info@xebia-training.fr

Data

Formation « Sécurisez vos données sur Hadoop »

Avec Bruno Bouchahoua et Jonathan Norblin

2 jours, soit 14 heures

La sécurité vient bien trop souvent en dernier lorsque l’on met en place un cluster Hadoop qu’il soit On premise ou dans le Cloud. Or, toutes les briques de composants existent pour sécuriser efficacement son cluster Hadoop.

Ce cours avant tout pratique, se propose d’aborder une grande partie des aspects sécurité à mettre en place sur un cluster Hadoop.

Programme

La formation est majoritairement pratique sous forme de Hands On. Elle est centrée sur la distribution Cloudera mais s’applique aux autres distributions HortonWorks et MapR en grande majorité.

Le dernier chapitre ouvre le champs aux différents outils qui gravitent autour de la sécurité Hadoop pour les différentes distributions (Ranger, Atlas, Navigator).

Sécurité Linux
  • Réseau : Modes d’accès, découpage logique, protection
  • Authentification : Pam
  • Autorisations : DAC, MAC, SE Linux (LSM, macro fonctionnement)
  • Audit
  • Chiffrement
Sécurité Hadoop par défaut
  • Recommandations : Autorisations, accès, chiffrement
  • Exercice n° 1
Authentification : Kerberos
  • Qu’est ce que Kerberos ? Pourquoi Kerberos sur Hadoop ?
  • Installation
  • Exercice n° 2
Impacts Kerberos
  • Service de l’écosystème Hadoop
  • JAAS
  • Exercice n° 3
Group Mapping
  • Définition
  • Alternatives
  • Exercice n° 4
LDAP
  • Définition
  • Hue
  • Exercice n° 5
Autorisations
  • Gestion des autorisations
  • Apache Sentry
  • Administration
  • Exercice n° 6
Next steps
  • Autres distributions
  • Chiffrement
  • Audit
Conclusion

Objectif

Connaître les composants utilisés pour sécuriser un système Linux.

Connaître la sécurité Hadoop autours des axes

  • Réseau
  • Authentification
  • Autorisations
  • Chiffrement
  • Audit

Savoir installer, configurer, dimensionner les composants Hadoop pour être en mesure d’appliquer la sécurité dans son ensemble.

A l’issue de cette formation, vous serez en mesure de sécuriser un cluster Hadoop et de gérer les autorisations d’usage de la majorité des composants.

  • Hive
  • Impala
  • HBase
  • SolR
  • HDFS
  • Kafka
  • Flume
  • Hue

Vous connaîtrez les impacts de la sécurité aussi bien en terme de code, de configuration que de performance.

Un ensemble de bonnes pratiques seront transmises pour implémenter correctement la sécurité.

Méthodes pédagogiques

Ce cours de 2 jours est découpé en 6 modules avec une validation des acquis à la fin de chaque module sous forme de démo.

Tarif HT

Inter : 1 800 €

Intra : Selon demande

Prochaines dates de formation

2 – 3 juillet

22 – 23 octobre

Biographie

Bruno Bouchahoua

Bruno Bouchahoua est un ingénieur Systèmes & logiciels spécialisé dans les systèmes distribués.

  • Développement logiciel sur écosystème Hadoop avec Spark
  • Administration de cluster.
  • NoSQL avec HBase et Mongo Db.
  • Conception & développement d'applications distribuées.
  • Industrialisation des développements.
  • DevOps autour des stack Data
  • Sécurité des systèmes distribués
  • Déploiement dans le Cloud et définition d'architectures Cloud

Actuellement, il oeuvre au sein de missions d'expertise en tant que Data Architect sur des environnements à forte volumétrie dans différents secteurs d'activité.

Bruno anime plusieurs formations chez Xebia Training autour du domaine de la data.
Il a également été speaker lors du Mois de la Data et participé à l'élaboration d'articles sur le blog technique de Xebia.

 

Validation

À la fin de cette formation, les stagiaires recevront une attestation de présence.

SOFTWARE TRAINING DONE RIGHT