Resumen de los puntos de conexión interactivos - Amazon EMR

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Resumen de los puntos de conexión interactivos

Un punto de conexión interactivo permite a los clientes interactivos, como Amazon EMR Studio, conectarse a Amazon EMR en EKS clústeres para ejecutar cargas de trabajo interactivas. El punto de conexión interactivo está respaldado por una puerta de enlace de Jupyter Enterprise que proporciona la capacidad de administración remota del ciclo de vida de los kernels que necesitan los clientes interactivos. Los kernels son procesos específicos del lenguaje que interactúan con el cliente Amazon EMR Studio basado en Jupyter para ejecutar cargas de trabajo interactivas.

Los puntos de conexión interactivos admiten los siguientes kernels:

  • Python 3

  • PySpark en Kubernetes

  • Apache Spark con Scala

nota

Amazon EMR on Price EKS se aplica a los kernels y puntos de conexión interactivos. Para obtener más información, consulta la página EMR de EKS precios de Amazon.

Se requieren las siguientes entidades para que EMR Studio se conecte con Amazon EMR enEKS.

  • Amazon EMR en un clúster EKS virtual: un clúster virtual es un espacio de nombres de Kubernetes en el que registras Amazon. EMR Amazon EMR usa clústeres virtuales para ejecutar trabajos y alojar puntos de conexión. Puede respaldar varios clústeres virtuales con el mismo clúster físico. Sin embargo, cada clúster virtual se asigna a un espacio de nombres en un clúster de AmazonEKS. Los clústeres virtuales no crean ningún recurso activo que contribuya a su factura o que requiera una administración del ciclo de vida externa al servicio.

  • Amazon EMR en un punto final EKS interactivo: un punto final interactivo es un HTTPS punto final al que los usuarios de EMR Studio pueden conectar un espacio de trabajo. Solo puede acceder a los HTTPS puntos de enlace desde su EMR Studio y los crea en una subred privada de Amazon Virtual Private Cloud VPC (Amazon) para su clúster de AmazonEKS.

    Los núcleos de Python y Spark Scala utilizan los permisos definidos en tu rol de Amazon EMR on EKS Job Execution para invocar otros. PySpark Servicios de AWS Todos los kernels y usuarios que se conectan al punto de conexión interactivo utilizan el rol que usted especificó al crear el punto de conexión. Te recomendamos que crees puntos de conexión independientes para los distintos usuarios y que los usuarios tengan funciones diferentes AWS Identity and Access Management (). IAM

  • AWS Controlador Application Load Balancer: el controlador AWS Application Load Balancer administra Elastic Load Balancing para un clúster de Amazon EKS Kubernetes. El controlador aprovisiona un Application Load Balancer (ALB) al crear un recurso de Kubernetes Ingress. A ALB expone un servicio de Kubernetes, como un punto final interactivo, fuera del EKS clúster de Amazon pero dentro del mismo Amazon. VPC Al crear un punto final interactivo, también se implementa un recurso de Ingress que expone el punto final interactivo mediante el cual los clientes interactivos pueden conectarse a ellosALB. Solo necesitas instalar un controlador AWS Application Load Balancer para cada clúster de AmazonEKS.

El siguiente diagrama muestra la arquitectura de puntos de conexión interactivos en Amazon EMR onEKS. Un EKS clúster de Amazon comprende el procesamiento para ejecutar las cargas de trabajo analíticas y el punto final interactivo. El controlador de equilibrador de carga de aplicación se ejecuta en el espacio de nombres kube-system; las cargas de trabajo y los puntos de conexión interactivos se ejecutan en el espacio de nombres que especifique al crear el clúster virtual. Al crear un punto final interactivo, Amazon EMR en el plano de EKS control crea el despliegue del punto final interactivo en el EKS clúster de Amazon. Además, el controlador del balanceador de carga crea una instancia de entrada al balanceador de AWS carga de aplicaciones. El balanceador de carga de aplicaciones proporciona la interfaz externa para que clientes como EMR Studio se conecten al EMR clúster de Amazon y ejecuten cargas de trabajo interactivas.

Diagrama de la arquitectura de puntos de conexión interactivos