Übersicht über interaktive Endpunkte - Amazon EMR

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Übersicht über interaktive Endpunkte

Ein interaktiver Endpunkt bietet interaktiven Clients wie Amazon EMR Studio die Möglichkeit, sich mit Amazon EMR in EKS-Clustern zu verbinden, um interaktive Workloads auszuführen. Der interaktive Endpunkt wird von einem Jupyter Enterprise Gateway unterstützt, das die Funktionen zur Verwaltung des Kernel-Lebenszyklus per Fernzugriff bereitstellt, die interaktive Clients benötigen. Kernel sind sprachspezifische Prozesse, die mit dem auf Jupyter basierenden Amazon-EMR-Studio-Client interagieren, um interaktive Workloads auszuführen.

Interaktive Endpunkte unterstützen die folgenden Kernel:

  • Python 3

  • PySpark auf Kubernetes

  • Apache Spark mit Scala

Anmerkung

Die Preise für Amazon EMR in EKS gelten für die interaktiven Endpunkte und Kernel. Weitere Informationen finden Sie auf der Preisseite für Amazon EMR in EKS.

Die folgenden Entitäten sind erforderlich, damit EMR Studio eine Verbindung mit Amazon EMR in EKS herstellen kann.

  • Virtueller Amazon EMR in EKS-Cluster – Ein virtueller Cluster ist ein Kubernetes-Namespace, bei dem Sie Amazon EMR registrieren. Amazon EMR verwendet virtuelle Cluster, um Aufträge auszuführen und Endpunkte zu hosten. Sie können mehrere virtuelle Cluster mit demselben physischen Cluster sichern. Jeder virtuelle Cluster ist jedoch einem Namespace auf einem Amazon-EKS-Cluster zugeordnet. Virtuelle Cluster erzeugen keine aktiven Ressourcen, die zu Ihrer Rechnung beitragen oder für die ein Lebenszyklus-Management außerhalb des Services erforderlich ist.

  • Interaktiver Endpunkt von Amazon EMR in EKS – Ein interaktiver Endpunkt ist ein HTTPS-Endpunkt, mit dem EMR-Studio-Benutzer eine Verbindung zu einem Workspace herstellen können. Sie können nur von Ihrem EMR Studio aus auf die HTTPS-Endpunkte zugreifen und sie in einem privaten Subnetz der Amazon Virtual Private Cloud (Amazon VPC) für Ihren Amazon-EKS-Cluster erstellen.

    Die Python- PySpark, und Spark-Scala-Kernel verwenden die in Ihrer Amazon EMR on EKS-Jobausführungsrolle definierten Berechtigungen, um andere aufzurufen. AWS-Services Alle Kernel und Benutzer, die eine Verbindung zum interaktiven Endpunkt herstellen, verwenden die Rolle, die Sie bei der Erstellung des Endpunkts angegeben haben. Wir empfehlen, separate Endpoints für verschiedene Benutzer zu erstellen und dafür zu sorgen, dass die Benutzer unterschiedliche Rollen (IAM) haben. AWS Identity and Access Management

  • AWS Application Load Balancer Balancer-Controller — Der AWS Application Load Balancer Balancer-Controller verwaltet Elastic Load Balancing für einen Amazon EKS Kubernetes-Cluster. Der Controller stellt einen Application Load Balancer (ALB) bereit, wenn Sie eine Kubernetes-Ingress-Ressource erstellen. Ein ALB macht einen Kubernetes-Service, z. B. einen interaktiven Endpunkt, außerhalb des Amazon-EKS-Clusters, aber innerhalb derselben Amazon VPC verfügbar. Wenn Sie einen interaktiven Endpunkt erstellen, wird auch eine Ingress-Ressource bereitgestellt, die den interaktiven Endpunkt über die ALB verfügbar macht, damit interaktive Clients eine Verbindung herstellen können. Sie müssen nur einen AWS Application Load Balancer Balancer-Controller für jeden Amazon EKS-Cluster installieren.

Das folgende Diagramm zeigt die interaktive Endpunktarchitektur in Amazon EMR in EKS. Ein Amazon-EKS-Cluster umfasst die Rechenleistung zur Ausführung der analytischen Workloads und den interaktiven Endpunkt. Der Application-Load-Balancer-Controller wird im kube-system-Namespace ausgeführt. Die Workloads und interaktiven Endpunkte werden in dem Namespace ausgeführt, den Sie bei der Erstellung des virtuellen Clusters angeben. Wenn Sie einen interaktiven Endpunkt erstellen, erstellt die Amazon EMR in EKS-Kontrollebene die interaktive Endpunktbereitstellung im Amazon-EKS-Cluster. Darüber hinaus wird vom Load Balancer-Controller eine Instance des Application Load Balancer-Eingangs AWS erstellt. Der Application Load Balancer stellt die externe Schnittstelle für Clients wie EMR Studio bereit, um eine Verbindung zum Amazon-EMR-Cluster herzustellen und interaktive Workloads auszuführen.

Diagramm der interaktiven Endpunktarchitektur