Configuración de software del clúster - Amazon EMR

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Configuración de software del clúster

Cuando selecciona una versión de software, Amazon EMR utiliza una imagen de máquina de Amazon (AMI) con Amazon Linux para instalar el software que usted elija al lanzar un clúster, como Hadoop, Spark y Hive. Amazon EMR ofrece nuevas versiones de forma periódica, agregando nuevas características y aplicaciones, además de actualizaciones generales. Le recomendamos que utilice la última versión para lanzar el clúster siempre que sea posible. La última versión es la opción predeterminada al lanzar un clúster desde la consola.

Para más información sobre las versiones de Amazon EMR y las versiones de software disponibles en cada lanzamiento, consulte la Guía de versiones de Amazon EMR. Para más información sobre cómo editar las configuraciones predeterminadas de aplicaciones y software instalados en su clúster, consulte Configuración de aplicaciones en la Guía de versiones de Amazon EMR. Algunas versiones de los componentes del ecosistema de Hadoop y Spark de código abierto que se incluyen en las versiones de Amazon EMR tienen parches y mejoras, que se documentan en la Guía de versiones de Amazon EMR.

Además del software y las aplicaciones estándar que están disponibles para su instalación en su clúster, puede utilizar acciones de arranque para instalar software personalizado. Las acciones de arranque son scripts que se ejecutan en las instancias cuando se lanza el clúster y que se ejecutan en nuevos nodos que se añaden a su clúster cuando se crean. Las acciones de Bootstrap también son útiles para invocar AWS CLI comandos en cada nodo para copiar objetos de Amazon S3 a cada nodo del clúster.

nota

Las acciones de arranque se utilizan de forma distinta en Amazon EMR versión 4.x y posteriores. Para más información sobre estas diferencias respecto a las versiones 2.x y 3.x de la AMI de Amazon EMR, consulte Diferencias introducidas en la versión 4.x en la Guía de versiones de Amazon EMR.