Utilice el escalado de EMR clústeres de Amazon para adaptarse a las cargas de trabajo cambiantes - Amazon EMR

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Utilice el escalado de EMR clústeres de Amazon para adaptarse a las cargas de trabajo cambiantes

Puedes ajustar el número de EC2 instancias de Amazon disponibles en un EMR clúster de Amazon de forma automática o manual en respuesta a cargas de trabajo que tengan diferentes demandas. Para utilizar el escalado automático, tiene dos opciones. Puedes activar el escalado EMR gestionado por Amazon o crear una política de escalado automático personalizada. En la siguiente tabla se describen las diferencias entre las dos opciones.

EMREscalado gestionado por Amazon Escalado automático personalizado

Políticas y reglas de escalado

No se requiere ninguna política. Amazon EMR gestiona la actividad de escalado automático mediante la evaluación continua de las métricas del clúster y la toma de decisiones de escalado optimizadas.

Debe definir y administrar las políticas y reglas de escalado automático, como las condiciones específicas que desencadenan actividades de escalado, periodos de evaluación, periodos de recuperación, etc.

EMRVersiones de Amazon compatibles

Amazon EMR versión 5.30.0 y superior (excepto Amazon EMR versión 6.0.0)

Amazon EMR versión 4.0.0 y superior

Composición del clúster admitida

Grupos de instancias o flotas de instancias

Solo grupos de instancias

Configuración de límites de escalado

Los límites de escalado se configuran para todo el clúster.

Los límites de escalado solo se pueden configurar para cada grupo de instancias.

Frecuencia de evaluación de las métricas

Cada 5-10 segundos

Una evaluación más frecuente de las métricas permite EMR a Amazon tomar decisiones de escalado más precisas.

Puede definir los periodos de evaluación solo en incrementos de cinco minutos.

Aplicaciones compatibles

Solo se admiten YARN aplicaciones, como Spark, Hadoop, Hive y Flink. El escalado EMR administrado por Amazon no admite aplicaciones que no estén basadas enYARN, como Presto oHBase.

Puede elegir qué aplicaciones se admiten cuando defina las reglas de escalado automático.

Consideraciones

  • Un EMR clúster de Amazon siempre consta de uno o tres nodos principales. Una vez que haya configurado inicialmente el clúster, solo podrá escalar los nodos principales y de tareas. No puede escalar el número de nodos principales del clúster.

  • En el caso de los grupos de instancias, las operaciones de reconfiguración y cambio de tamaño se realizan de forma consecutiva y no simultánea. Si inicia una reconfiguración mientras se está cambiando el tamaño de un grupo de instancias, la reconfiguración comienza una vez que el grupo de instancias complete el cambio de tamaño en curso. Por el contrario, si inicia una operación de cambio de tamaño mientras se está reconfigurando un grupo de instancias, se cambiará el tamaño en el momento.