Qu'est-ce qu'Amazon EMR on EKS ? - Amazon EMR

Qu'est-ce qu'Amazon EMR on EKS ?

Amazon EMR on EKS offre une option de déploiement pour Amazon EMR qui vous permet d'exécuter des environnements de big data open-source sur Amazon Elastic Kubernetes Service (Amazon EKS). Grâce à cette option de déploiement, vous pouvez vous concentrer sur l'exécution des charges de travail analytiques pendant qu'Amazon EMR on EKS crée, configure et gère les conteneurs pour les applications open-source.

Si vous utilisez déjà Amazon EMR, vous pouvez désormais exécuter des applications basées sur Amazon EMR avec d'autres types d'applications sur le même cluster Amazon EKS. Cette option de déploiement améliore également l'utilisation des ressources et simplifie la gestion de l'infrastructure dans plusieurs zones de disponibilité. Si vous exécutez déjà des environnements de big data sur Amazon EKS, vous pouvez désormais utiliser Amazon EMR pour automatiser le provisionnement et la gestion, et exécuter Apache Spark plus rapidement.

Amazon EMR on EKS permet à votre équipe de collaborer plus efficacement et de traiter de grandes quantités de données plus facilement et à moindre coût :

  • Vous pouvez exécuter des applications sur un groupe commun de ressources sans avoir à provisionner l'infrastructure. Vous pouvez utiliser Amazon EMR Studio et le kit SDK AWS ou AWS CLI pour développer, soumettre et diagnostiquer des applications d'analyse exécutées sur des clusters EKS. Vous pouvez exécuter des tâches planifiées sur Amazon EMR on EKS en utilisant Apache Airflow ou Amazon Managed Workflows for Apache Airflow (MWAA).

  • Les équipes d'infrastructure peuvent gérer de manière centralisée une plateforme informatique commune pour consolider les charges de travail Amazon EMR avec d'autres applications basées sur des conteneurs. Vous pouvez simplifier la gestion de l'infrastructure avec les outils courants d'Amazon EKS et tirer parti d'un cluster partagé pour les charges de travail qui nécessitent différentes versions d'environnements open-source. Vous pouvez également réduire les frais généraux opérationnels grâce à l'automatisation de la gestion des clusters Kubernetes et l'application des correctifs du système d'exploitation. Avec Amazon EC2 et AWS Fargate, vous pouvez activer plusieurs ressources de calcul pour répondre à des exigences de performance, opérationnelles ou financières.

Le diagramme suivant illustre les deux modèles de déploiement d'Amazon EMR.


   Options de déploiement d'Amazon EMR