Diagramación de métricas de escalado administrado

Descripción de las métricas de escalado administrado en Amazon EMR

Amazon EMR publica métricas de alta resolución con datos en una granularidad de un minuto cuando se habilita el escalado administrado para un clúster. Puede ver los eventos de cada inicio y finalización del cambio de tamaño controlados mediante el escalado gestionado con la consola Amazon EMR o la consola Amazon CloudWatch . CloudWatch las métricas son fundamentales para que funcione el escalado gestionado de Amazon EMR. Le recomendamos que supervise de cerca CloudWatch las métricas para asegurarse de que no falten datos. Para obtener más información sobre cómo configurar CloudWatch las alarmas para detectar las métricas faltantes, consulta Uso de CloudWatch las alarmas de Amazon. Para obtener más información sobre el uso de CloudWatch eventos con Amazon EMR, consulte Supervisar CloudWatch eventos.

Las siguientes métricas indican la capacidad actual o prevista de un clúster. Estas métricas solo están disponibles cuando el escalado administrado está habilitado. Para los clústeres compuestos por flotas de instancias, las métricas de capacidad del clúster se miden en Units. Para los clústeres compuestos por grupos de instancias, las métricas de capacidad del clúster se miden en Nodes o en vCPU en función del tipo de unidad utilizado en la política de escalado administrado.

Métrica	Descripción
`TotalUnitsRequested` `TotalNodesRequested` `TotalVCPURequested`	El número total objetivo de units/nodes/vCPUs un clúster, determinado por el escalado administrado. Unidades: recuento
`TotalUnitsRunning` `TotalNodesRunning` `TotalVCPURunning`	El número total actual de units/nodes/vCPUs disponibles en un clúster en ejecución. Cuando se solicita un cambio de tamaño del clúster, esta métrica se actualizará después de agregar o quitar las nuevas instancias del clúster. Unidades: recuento
`CoreUnitsRequested` `CoreNodesRequested` `CoreVCPURequested`	El número objetivo de CORE units/nodes/vCPUs en un clúster, determinado por el escalado gestionado. Unidades: recuento
`CoreUnitsRunning` `CoreNodesRunning` `CoreVCPURunning`	El número actual de CORE units/nodes/vCPUs que se ejecutan en un clúster. Unidades: recuento
`TaskUnitsRequested` `TaskNodesRequested` `TaskVCPURequested`	El número objetivo de TAREAS units/nodes/vCPUs en un clúster, determinado por el escalado gestionado. Unidades: recuento
`TaskUnitsRunning` `TaskNodesRunning` `TaskVCPURunning`	El número actual de TAREAS units/nodes/vCPUs que se están ejecutando en un clúster. Unidades: recuento

Las siguientes métricas indican el estado de uso del clúster y las aplicaciones. Estas métricas están disponibles para todas las características de Amazon EMR, pero se publican con una resolución más alta con datos y una granularidad de un minuto cuando se habilita el escalado administrado para un clúster. Puede comparar las siguientes métricas con las métricas de capacidad del clúster de la tabla anterior para conocer las decisiones de escalado administrado.

Métrica	Descripción
`AppsCompleted`	El número de aplicaciones enviadas a YARN que se han completado. Caso de uso: monitorizar el progreso del clúster Unidades: recuento
`AppsPending`	El número de aplicaciones enviadas a YARN que están en estado pendiente. Caso de uso: monitorizar el progreso del clúster Unidades: recuento
`AppsRunning`	El número de aplicaciones enviadas a YARN que se están ejecutando. Caso de uso: monitorizar el progreso del clúster Unidades: recuento
`ContainerAllocated`	El número de contenedores de recursos asignados porResourceManager. Caso de uso: monitorizar el progreso del clúster Unidades: recuento
`ContainerPending`	El número de contenedores en la cola que aún no se han asignado. Caso de uso: monitorizar el progreso del clúster Unidades: recuento
`ContainerPendingRatio`	La relación entre los contenedores pendientes y los contenedores asignados (ContainerPendingRatio = ContainerPending / ContainerAllocated). Si ContainerAllocated = 0, entonces ContainerPendingRatio =ContainerPending. El valor de ContainerPendingRatio representa un número, no un porcentaje. Este valor es útil para escalar recursos del clúster en función del comportamiento de asignación de contenedores. Unidades: recuento
`HDFSUtilization`	El porcentaje de almacenamiento HDFS usado actualmente. Caso de uso: analizar el rendimiento del clúster Unidades: porcentaje
`IsIdle`	Indica que un clúster ya no está funcionando, pero sigue activo y acumulando cargos. Se establece en 1 si no se ejecuta ninguna tarea ni ningún trabajo; en caso contrario, se establece en 0. Este valor se comprueba a intervalos de cinco minutos, y un valor de 1 indica que el clúster estaba inactivo cuando se comprobó, no que estuvo inactivo durante los cinco minutos. Para evitar falsos positivos, debe activar una alarma cuando este valor sea 1 durante más de una comprobación consecutiva de cinco minutos. Por ejemplo, puede activar una alarma cuando este valor sea 1 durante treinta minutos o más. Caso de uso: monitorizar el rendimiento del clúster Unidades: booleano
`MemoryAvailableMB`	La cantidad de memoria disponible para asignar. Caso de uso: monitorizar el progreso del clúster Unidades: recuento
`MRActiveNodes`	El número de nodos que actualmente ejecutan MapReduce tareas o trabajos. Equivalente a la métrica YARN `mapred.resourcemanager.NoOfActiveNodes`. Caso de uso: monitorizar el progreso del clúster Unidades: recuento
`YARNMemoryAvailablePercentage`	El porcentaje de memoria restante disponible para YARN (YARNMemoryAvailablePercentage = MemoryAvailable MB/MemoryTotalMB). Este valor es útil para escalar recursos del clúster en función del uso de memoria de YARN. Unidades: porcentaje

Las siguientes métricas proporcionan información sobre los recursos utilizados por los contenedores y nodos de YARN. Estas métricas del administrador de recursos de YARN ofrecen información sobre los recursos que utilizan los contenedores y los nodos que se ejecutan en el clúster. Al comparar estas métricas con las métricas de capacidad del clúster de la tabla anterior, se obtiene una imagen más clara del impacto del escalado gestionado:

Métrica	Versiones asociadas	Descripción
`YarnContainersUsedMemoryGBSeconds`	Disponible para la etiqueta de lanzamiento 7.3.0 y versiones posteriores	La memoria consumida en el contenedor (* segundos) durante el período de publicación. Unidades: GB * segundos
`YarnContainersTotalMemoryGBSeconds`	Disponible para la etiqueta de lanzamiento 7.3.0 y versiones posteriores	El contenido total de lana (* segundos) durante el período de publicación. Unidades: GB * segundos
`YarnContainersUsedVCPUSeconds`	Disponible para la etiqueta de lanzamiento 7.5.0 y superior	Los segundos de CPU virtual del contenedor consumidos durante el período de publicación. Unidades: CPU vCPU * segundos
`YarnContainersTotalVCPUSeconds`	Disponible para la etiqueta de lanzamiento 7.5.0 y versiones posteriores	El total de segundos de CPU virtual del contenedor durante el período de publicación. Unidades: CPU vCPU (* segundos)
`YarnNodesUsedMemoryGBSeconds`	Disponible para la etiqueta de lanzamiento 7.5.0 y versiones posteriores	La memoria del nodo consumida en segundos durante el período de publicación. Unidades: GB * segundos
`YarnNodesTotalMemoryGBSeconds`	Disponible para la etiqueta de lanzamiento 7.5.0 y superior	La memoria total del nodo (* segundos) durante el período de publicación. Unidades: GB * segundos
`YarnNodesUsedVCPUSeconds`	Disponible para la etiqueta de lanzamiento 7.3.0 y versiones posteriores	Los segundos de CPU virtual del nodo consumidos durante el período de publicación. Unidades: CPU vCPU * segundos
`YarnNodesTotalVCPUSeconds`	Disponible para la etiqueta de lanzamiento 7.3.0 y versiones posteriores	El total de segundos de CPU virtual del nodo durante el período de publicación. Unidades: CPU virtual (* segundos)

Diagramación de métricas de escalado administrado

Puede diagramar las métricas para ver los patrones de carga de trabajo del clúster y las decisiones de escalado correspondientes tomadas por Escalado administrado de Amazon EMR, como se muestra en los pasos siguientes.

Para graficar las métricas de escalado gestionado en la consola CloudWatch

Abra la consola de CloudWatch.
En el panel de navegación, seleccione Amazon EMR. Puede buscar el identificador del clúster que desea monitorizar.
Desplácese hacia abajo hasta la métrica que desea representar gráficamente. Abra una métrica para mostrar el gráfico.
Para representar gráficamente una o varias métricas, seleccione la casilla de verificación junto a cada métrica.

En el siguiente ejemplo, se ilustra la actividad de Escalado administrado de Amazon EMR de un clúster. El gráfico muestra tres periodos de reducción de capacidad automática, que ahorran costos cuando hay una carga de trabajo menos activa.

Diagramar métricas de escalado administrado

Todas las métricas de capacidad y uso del clúster se publican a intervalos de un minuto. La información estadística adicional también se asocia a cada dato de un minuto, lo que le permite diagramar varias funciones como Percentiles, Min, Max, Sum, Average, SampleCount.

Por ejemplo, el siguiente gráfico muestra la misma métrica YARNMemoryAvailablePercentage en percentiles diferentes, P10, P50, P90, P99, junto con Sum, Average, Min, SampleCount.

Diagramar métricas de escalado administrado con diferentes percentiles

Aviso JavaScript está desactivado o no está disponible en su navegador.

Para utilizar la documentación de AWS, debe estar habilitado JavaScript. Para obtener más información, consulte las páginas de ayuda de su navegador.

Convenciones del documento

Estrategias de asignación de nodos

Escalado automático con una política personalizada