Amazon EMR en las versiones 7.1.0 de EKS - Amazon EMR

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Amazon EMR en las versiones 7.1.0 de EKS

Esta página describe la funcionalidad nueva y actualizada de Amazon EMR que es específica de la implementación de Amazon EMR en EKS. Para obtener más información sobre Amazon EMR que se ejecuta en Amazon EC2 y sobre la versión 7.1.0 de Amazon EMR en general, consulte Amazon EMR 7.1.0 en la Guía de versiones de Amazon EMR.

Amazon EMR en las versiones 7.1 de EKS

Las siguientes versiones 7.1.0 de Amazon EMR están disponibles para Amazon EMR en EKS. Seleccione una versión específica del EMR-7.1.0-xxxx para ver más detalles, como la etiqueta de imagen del contenedor correspondiente.

Flink releases

Las siguientes versiones 7.1.0 de Amazon EMR están disponibles para Amazon EMR en EKS cuando ejecuta aplicaciones Flink.

Spark releases

Las siguientes versiones 7.1.0 de Amazon EMR están disponibles para Amazon EMR en EKS cuando ejecuta aplicaciones Spark.

  • emr-7.1.0-latest

  • emr-7.1.0-20240321

  • emr-7.1.0-spark-rapids-latest

  • emr-7.1.0-spark-rapids-20240321

  • emr-7.1.0-java11-latest

  • emr-7.1.0-java11-20240321

  • emr-7.1.0-java8-latest

  • emr-7.1.0-java8-20240321

  • emr-7.1.0-spark-rapids-java8-latest

  • emr-7.1.0-spark-rapids-java8-20240321

  • notebook-spark/emr-7.1.0-latest

  • notebook-spark/emr-7.1.0-20240321

  • notebook-spark/emr-7.1.0-spark-rapids-latest

  • notebook-spark/emr-7.1.0-spark-rapids-20240321

  • notebook-spark/emr-7.1.0-java11-latest

  • notebook-spark/emr-7.1.0-java11-20240321

  • notebook-spark/emr-7.1.0-java8-latest

  • notebook-spark/emr-7.1.0-java8-20240321

  • notebook-spark/emr-7.1.0-spark-rapids-java8-latest

  • notebook-spark/emr-7.1.0-spark-rapids-java8-20240321

  • notebook-python/emr-7.1.0-latest

  • notebook-python/emr-7.1.0-20240321

  • notebook-python/emr-7.1.0-spark-rapids-latest

  • notebook-python/emr-7.1.0-spark-rapids-20240321

  • notebook-python/emr-7.1.0-java11-latest

  • notebook-python/emr-7.1.0-java11-20240321

  • notebook-python/emr-7.1.0-java8-latest

  • notebook-python/emr-7.1.0-java8-20240321

  • notebook-python/emr-7.1.0-spark-rapids-java8-latest

  • notebook-python/emr-7.1.0-spark-rapids-java8-20240321

  • livy/emr-7.1.0-latest

  • livy/emr-7.1.0-20240321

  • livy/emr-7.1.0-java11-latest

  • livy/emr-7.1.0-java11-20240321

  • livy/emr-7.1.0-java8-latest

  • livy/emr-7.1.0-java8-20240321

Notas de la versión

Notas de publicación de Amazon EMR en EKS 7.1.0

  • Aplicaciones compatibles: AWS SDK for Java 2.23.18 and 1.12.656, Apache Spark 3.5.0-amzn-1, Apache Hudi 0.14.1-amzn-0, Apache Iceberg 1.4.3-amzn-0, Delta 3.0.0, Apache Spark RAPIDS 23.10.0-amzn-1, Jupyter Enterprise Gateway 2.6.0, Apache Flink 1.18.1-amzn-0, Flink Operator 1.6.1-amzn-1

  • Componentes compatibles: aws-sagemaker-spark-sdk, emr-ddb, emr-goodies, emr-s3-select, emrfs, hadoop-client, hudi, hudi-spark, iceberg, spark-kubernetes.

  • Clasificaciones de configuración compatibles

    Para su uso con las API StartJobRun: CreateManagedEndpoint

    Clasificaciones Descripciones

    core-site

    Cambia los valores en el archivo de Hadoop core-site.xml.

    emrfs-site

    Cambiar la configuración de EMRFS.

    spark-metrics

    Cambia los valores en el archivo de Spark metrics.properties.

    spark-defaults

    Cambia los valores en el archivo de Spark spark-defaults.conf.

    spark-env

    Cambiar los valores en el entorno de Spark.

    spark-hive-site

    Cambia los valores en el archivo de Spark hive-site.xml.

    spark-log4j2

    Cambia los valores en el archivo de Spark log4j2.properties.

    emr-job-submitter

    Configuración del pod de remitente de trabajos.

    Para usar específicamente con CreateManagedEndpointlas API:

    Clasificaciones Descripciones

    jeg-config

    Cambia los valores en el archivo jupyter_enterprise_gateway_config.py de Jupyter Enterprise Gateway.

    jupyter-kernel-overrides

    Cambia el valor de la imagen del kernel en el archivo de especificaciones del kernel de Jupyter.

    Las clasificaciones de configuración le permiten personalizar las aplicaciones. Suelen corresponder a un archivo XML de configuración para la aplicación como, por ejemplo, spark-hive-site.xml. Para obtener más información, consulte Configurar aplicaciones.

Características notables

La versión 7.1.0 de Amazon EMR en EKS incluye las siguientes funciones.

  • Soporte de Apache Livy para Amazon EMR en EKS: con Amazon EMR en las versiones 7.1.0 y posteriores de EKS, puede usar Apache Livy en un clúster de Amazon EKS para crear una interfaz REST de Apache Livy y enviar trabajos de Spark o fragmentos de código de Spark. De este modo, podrá recuperar los resultados de forma sincrónica y asíncrona y, al mismo tiempo, aprovechar las ventajas de Amazon EMR en EKS, como el tiempo de ejecución de Spark optimizado para Amazon EMR, los puntos de enlace Livy habilitados para SSL y una experiencia de configuración programática.

Cambios

Los siguientes cambios se incluyen en la versión 7.1.0 de Amazon EMR en EKS.

  • Con Amazon EMR en EKS 7.1.0 y versiones posteriores, Apache Flink ahora usa el tiempo de ejecución Java 17 de forma predeterminada.