Monitorización de métricas con CloudWatch - Amazon EMR

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Monitorización de métricas con CloudWatch

Las métricas se actualizan cada cinco minutos y se recogen automáticamente y se envían a CloudWatch por cada clúster de EMR. Este intervalo no se puede configurar. No se aplican cargos por las métricas de Amazon EMR notificadas en CloudWatch. Las métricas se archivan durante dos semanas; tras las cuales, los datos se descartan.

¿Cómo utilizo las métricas de Amazon EMR?

Las métricas mostradas por Amazon EMR proporcionan información que puede analizar de diferentes maneras. En la siguiente tabla se indican algunos usos frecuentes de las métricas. Se trata de sugerencias que puede usar como punto de partida y no de una lista completa. Para obtener una lista completa de las métricas notificadas por Amazon EMR, consulte Métricas notificadas por Amazon EMR en CloudWatch.

¿Cómo? Métricas relevantes
Realizar un seguimiento del progreso de mi clúster Mire el RunningMapTasksde RemainingMapTasksde RunningReduceTasks, y RemainingReduceTasks Las métricas de.
Detectar clústeres que están inactivos La métrica IsIdle realiza un seguimiento de si el clúster está disponible, pero actualmente no está ejecutando ninguna tarea. Puede configurar una alarma para que se active cuando el clúster haya estado inactivo durante un periodo de tiempo determinado, como, por ejemplo, treinta minutos.
Detectar si un nodo se queda sin espacio de almacenamiento La métrica HDFSUtilization es el porcentaje de espacio en disco que se utiliza actualmente. Si esto supera un nivel aceptable para su aplicación, como, por ejemplo, el 80% de la capacidad utilizada, es posible que tenga que cambiar el tamaño de su clúster y añadir más nodos secundarios.

Acceso a las métricas de CloudWatch

Existen muchas formas de obtener acceso a las métricas que Amazon EMR envía a CloudWatch. Puede verlas a través de la consola de Amazon EMR o de la consola de CloudWatch, y también puede obtener acceso a ellas a través de la CLI de CloudWatch o la API de CloudWatch. Los siguientes procedimientos le muestran cómo obtener acceso a las métricas a través de estas herramientas.

Para ver métricas en la consola de Amazon EMR

  1. Abra la consola de Amazon EMR en https://console.aws.amazon.com/elasticmapreduce/.

  2. Para ver las métricas de un clúster, seleccione un clúster para mostrar el panel Summary (Resumen).

  3. Elija Monitoring (Monitorización) para ver información sobre dicho clúster. Elija cualquiera de las pestañas denominadas Cluster Status (Estado del clúster), Map/Reduce, Node Status (Estado del nodo), IO (E/S) o HBase para cargar los informes acerca del progreso y el estado del clúster.

  4. Después de elegir una métrica que ver, puede seleccionar un tamaño de gráfico. Edite los campos Start (Inicio) y End (Finalización) para filtrar las métricas según un marco temporal específico.

    
									Tutorial de alarma de métricas

Para ver métricas en la consola de CloudWatch

  1. Abra la consola de CloudWatch en https://console.aws.amazon.com/cloudwatch/.

  2. En el panel de navegación, elija EMR.

  3. Desplácese hacia abajo hasta la métrica que desea representar gráficamente. Puede buscar el identificador del clúster que desea monitorizar.

    
								Tutorial de alarma de métricas
  4. Abra una métrica para mostrar el gráfico.

    
									Tutorial de alarma de métricas

Para obtener acceso a las métricas desde la CLI de CloudWatch

Para obtener acceso a las métricas desde la API de CloudWatch

Configurar alarmas de métricas

Amazon EMR envía métricas a CloudWatch, lo que significa que puede utilizar CloudWatch para establecer alarmas en las métricas de Amazon EMR. Puede, por ejemplo, configurar una alarma en CloudWatch para enviar un correo electrónico siempre que el uso de HDFS supere el 80%.

Los siguientes temas ofrecen información general de alto nivel sobre cómo definir alarmas mediante CloudWatch. Para obtener instrucciones detalladas, consulte el tema relacionado con la creación o edición de una alarma de CloudWatch en la Guía del usuario de Amazon CloudWatch.

Establecer alarmas utilizando la consola de CloudWatch

  1. Abra la consola de CloudWatch en https://console.aws.amazon.com/cloudwatch/.

  2. Elija Create Alarm. Esto lanza el Create Alarm Wizard (Asistente de creación de alarmas).

  3. Elija EMR Metrics (Métricas de EMR) y desplácese a través de las métricas de Amazon EMR para localizar la métrica donde desea colocar una alarma. Una forma sencilla de mostrar las métricas de Amazon EMR en este cuadro de diálogo consiste en buscar el identificador de su clúster. Seleccione la métrica para crear una alarma y elija Next (Siguiente).

  4. Rellene los valores Name (Nombre), Description (Descripción), Threshold (Umbral) y Time (Hora) de la métrica.

  5. Si desea que CloudWatch le envíe un correo electrónico cuando se alcance el estado de la alarma, en el campo Whenever this alarm (Siempre que esta alarma), elija State is ALARM (El estado es ALARM). En Send notification to: (Enviar notificación a), seleccione un tema de SNS existente. Si elige Create topic (Crear tema), puede definir el nombre y las direcciones de correo electrónico de una nueva lista de suscripción de correo electrónico. Esta lista se guarda y aparece en el campo para futuras alarmas.

    nota

    Si utiliza Create topic para crear un nuevo tema de Amazon SNS, debe verificar las direcciones de correo electrónico para que reciban notificaciones. Los correos electrónicos solo se envían cuando la alarma entra en estado de alarma. Si este cambio en el estado de la alarma se produce antes de que se verifiquen las direcciones de correo electrónico, no reciben una notificación.

  6. En este momento, la pantalla Define Alarm (Definir alarma) le ofrece la oportunidad de revisar la alarma que está a punto de crear. Elija Create Alarm.

nota

Para obtener más información sobre cómo definir alarmas con la consola de CloudWatch, consulte el tema relacionado con la creación de alarmas que envían correo electrónico en la Guía del usuario de Amazon CloudWatch.

Para configurar una alarma mediante la API de CloudWatch

Para configurar una alarma mediante la API de CloudWatch

Métricas notificadas por Amazon EMR en CloudWatch

La siguiente tabla muestra todas las métricas que Amazon EMR notifica en la consola y envía a CloudWatch.

Métricas Amazon EMR

Amazon EMR envía datos de varias métricas a CloudWatch. Todos los clústeres de Amazon EMR envían automáticamente métricas en intervalos de cinco minutos. Las métricas se archivan durante dos semanas; después de ese periodo, los datos se descartan.

El espacio de nombres de AWS/ElasticMapReduce incluye las siguientes métricas.

nota

Amazon EMR obtiene las métricas de un clúster. Si un clúster deja de estar disponible, no se registra ninguna métrica hasta que el clúster vuelve a estar disponible.

Están disponibles las siguientes métricas para los clústeres que ejecutan las versiones 2.x de Hadoop.

Métrica ​Descripción
Estado del clúster

IsIdle

Indica que un clúster ya no está funcionando, pero sigue activo y acumulando cargos. Se establece en 1 si no se ejecuta ninguna tarea ni ningún trabajo; en caso contrario, se establece en 0. Este valor se comprueba a intervalos de cinco minutos, y un valor de 1 indica que el clúster estaba inactivo cuando se comprobó, no que estuvo inactivo durante los cinco minutos. Para evitar falsos positivos, debe activar una alarma cuando este valor sea 1 durante más de una comprobación consecutiva de cinco minutos. Por ejemplo, puede activar una alarma cuando este valor sea 1 durante treinta minutos o más.

Caso de uso: [EMPTY] clúster rendimiento

Unidades: Booleano

ContainerAllocated

El número de contenedores de recursos asignados por ResourceManager.

Caso de uso: [EMPTY] clúster progreso

Unidades: Count

ContainerReserved

El número de contenedores reservados.

Caso de uso: [EMPTY] clúster progreso

Unidades: Count

ContainerPending

El número de contenedores en la cola que aún no se han asignado.

Caso de uso: [EMPTY] clúster progreso

Unidades: Count

ContainerPendingRatio

La proporción entre contenedores pendientes y contenedores asignados (ContainerPendingRatio = ContainerPending / ContainerAllocated). Si ContainerAllocated = 0, entonces ContainerPendingRatio = ContainerPending. El valor de ContainerPendingRatio representa un número, no un porcentaje. Este valor es útil para escalar recursos del clúster en función del comportamiento de asignación de contenedores.

Unidades: Count

AppsCompleted

El número de aplicaciones enviadas a YARN que se han completado.

Caso de uso: [EMPTY] clúster progreso

Unidades: Count

AppsFailed

El número de aplicaciones enviadas a YARN que no se han podido completar.

Caso de uso: [EMPTY] clúster progreso, Monitorización clúster salud

Unidades: Count

AppsKilled

El número de aplicaciones enviadas a YARN que se han cancelado.

Caso de uso: [EMPTY] clúster progreso, Monitorización clúster salud

Unidades: Count

AppsPending

El número de aplicaciones enviadas a YARN que están en estado pendiente.

Caso de uso: [EMPTY] clúster progreso

Unidades: Count

AppsRunning

El número de aplicaciones enviadas a YARN que se están ejecutando.

Caso de uso: [EMPTY] clúster progreso

Unidades: Count

AppsSubmitted

El número de aplicaciones enviadas a YARN.

Caso de uso: [EMPTY] clúster progreso

Unidades: Count

Estado del nodo

CoreNodesRunning

El número de nodos secundarios en funcionamiento. Los puntos de datos de esta métrica solo se registran cuando existe un grupo de instancias correspondiente.

Caso de uso: [EMPTY] clúster salud

Unidades: Count

CoreNodesPending

El número de nodos secundarios en espera de ser asignados. Puede que no todos los nodos secundarios solicitados estén disponibles inmediatamente; esta métrica registra las solicitudes pendientes. Los puntos de datos de esta métrica solo se registran cuando existe un grupo de instancias correspondiente.

Caso de uso: [EMPTY] clúster salud

Unidades: Count

LiveDataNodes

El porcentaje de nodos de datos que reciben trabajo de Hadoop.

Caso de uso: [EMPTY] clúster salud

Unidades: Porcentaje

MRTotalNodes

El número de nodos actualmente disponibles para trabajos de MapReduce. Equivalente a la métrica YARN mapred.resourcemanager.TotalNodes.

Use la siguiente información: [EMPTY] clúster progreso

Unidades: Count

MRActiveNodes

El número de nodos que se están ejecutando actualmente en tareas o trabajos de MapReduce. Equivalente a la métrica YARN mapred.resourcemanager.NoOfActiveNodes.

Caso de uso: [EMPTY] clúster progreso

Unidades: Count

MRLostNodes

El número de nodos asignados a MapReduce que se han marcado con el estado LOST. Equivalente a la métrica YARN mapred.resourcemanager.NoOfLostNodes.

Caso de uso: [EMPTY] clúster salud, Monitorización clúster progreso

Unidades: Count

MRUnhealthyNodes

El número de nodos disponibles para trabajos de MapReduce marcados con el estado UNHEALTHY. Equivalente a la métrica YARN mapred.resourcemanager.NoOfUnhealthyNodes.

Caso de uso: [EMPTY] clúster progreso

Unidades: Count

MRDecommissionedNodes

El número de nodos asignados a aplicaciones de MapReduce que se han marcado con el estado DECOMMISSIONED. Equivalente a la métrica YARN mapred.resourcemanager.NoOfDecommissionedNodes.

Use la siguiente información: [EMPTY] clúster salud, Monitorización clúster progreso

Unidades: Count

MRRebootedNodes

El número de nodos disponibles parea MapReduce que se han reiniciado y marcado con el estado REBOOTED. Equivalente a la métrica YARN mapred.resourcemanager.NoOfRebootedNodes.

Caso de uso: [EMPTY] clúster salud, Monitorización clúster progreso

Unidades: Count

MultiMasterInstanceGroupNodesRunning

El número de nodos principales en ejecución.

Caso de uso: Monitorizar el fallo y la sustitución del nodo principal

Unidades: Count

MultiMasterInstanceGroupNodesRunningPercentage

El porcentaje de nodos principales que se están ejecutando por encima del recuento de instancias del nodo principal solicitadas.

Caso de uso: Monitorizar el fallo y la sustitución del nodo principal

Unidades: Porcentaje

MultiMasterInstanceGroupNodesRequested

El número de nodos principales solicitados.

Caso de uso: Monitorizar el fallo y la sustitución del nodo principal

Unidades: Count

E/S

S3BytesWritten

El número de bytes escritos en Amazon S3.

Caso de uso: Analizar clúster rendimiento, Monitorización clúster progreso

Unidades: Count

S3BytesRead

El número de bytes leídos de Amazon S3.

Caso de uso: Analizar clúster rendimiento, Monitorización clúster progreso

Unidades: Count

HDFSUtilization

El porcentaje de almacenamiento HDFS usado actualmente.

Caso de uso: Analizar clúster rendimiento

Unidades: Porcentaje

HDFSBytesRead

El número de bytes leídos de HDFS. Esta métrica solo añade trabajos de MapReduce y no se aplica a otras cargas de trabajo de EMR.

Caso de uso: Analizar clúster rendimiento, Monitorización clúster progreso

Unidades: Count

HDFSBytesWritten

El número de bytes escritos en HDFS. Esta métrica solo añade trabajos de MapReduce y no se aplica a otras cargas de trabajo de EMR.

Caso de uso: Analizar clúster rendimiento, Monitorización clúster progreso

Unidades: Count

MissingBlocks

El número de bloques en los que HDFS no tiene réplicas. Pueden tratarse de bloques dañados.

Caso de uso: [EMPTY] clúster salud

Unidades: Count

CorruptBlocks

El número de bloques que HDFS registra como dañados.

Caso de uso: [EMPTY] clúster salud

Unidades: Count

TotalLoad

El número total de transferencias de datos simultáneas,

Caso de uso: [EMPTY] clúster salud

Unidades: Count

MemoryTotalMB

La cantidad de memoria total del clúster.

Caso de uso: [EMPTY] clúster progreso

Unidades: Count

MemoryReservedMB

La cantidad de memoria reservada.

Caso de uso: [EMPTY] clúster progreso

Unidades: Count

MemoryAvailableMB

La cantidad de memoria disponible para asignar.

Caso de uso: [EMPTY] clúster progreso

Unidades: Count

YARNMemoryAvailablePercentage

El porcentaje de memoria restante disponible para YARN (YARNMemoryAvailablePercentage = MemoryAvailableMB / MemoryTotalMB). Este valor es útil para escalar recursos del clúster en función del uso de memoria de YARN.

Unidades: Porcentaje

MemoryAllocatedMB

La cantidad de memoria asignada al clúster.

Caso de uso: [EMPTY] clúster progreso

Unidades: Count

PendingDeletionBlocks

El número de bloques marcados para eliminación.

Caso de uso: [EMPTY] clúster progreso, Monitorización clúster salud

Unidades: Count

UnderReplicatedBlocks

El número de bloques que necesitan replicarse una o varias veces.

Caso de uso: [EMPTY] clúster progreso, Monitorización clúster salud

Unidades: Count

DfsPendingReplicationBlocks

El estado de replicación del bloque: bloques que se están replicando, antigüedad de las solicitudes de replicación y solicitudes replicadas correctamente.

Caso de uso: [EMPTY] clúster progreso, Monitorización clúster salud

Unidades: Count

CapacityRemainingGB

La cantidad de capacidad de disco HDFS restante.

Caso de uso: [EMPTY] clúster progreso, Monitorización clúster salud

Unidades: Count

HBase

HbaseBackupFailed

Si la última copia de seguridad produjo un error. Está establecido en 0 de forma predeterminada y se actualiza a 1 si el intento de copia de seguridad anterior produjo un error. Esta métrica solo se registra para los clústers HBase.

Caso de uso: Monitorizar copias de seguridad de HBase

Unidades: Count

MostRecentBackupDuration

La cantidad de tiempo que tarda en completarse la copia de seguridad anterior. Esta métrica se establece independientemente de si la última copia de seguridad se realizó correctamente o produjo un error. Mientras la copia de seguridad está en curso, esta métrica devuelve el número de minutos tras el inicio de la copia de seguridad. Esta métrica solo se registra para los clústers HBase.

Caso de uso: Monitorizar copias de seguridad de HBase

Unidades: Minutos

TimeSinceLastSuccessfulBackup

El número de minutos que han transcurrido desde que la última copia de seguridad de HBase correcta se inició en el clúster. Esta métrica solo se registra para los clústers HBase.

Caso de uso: Monitorizar copias de seguridad de HBase

Unidades: Minutos

A continuación se indican las métricas de Hadoop 1:

Métrica ​Descripción
Estado del clúster

IsIdle

Indica que un clúster ya no está funcionando, pero sigue activo y acumulando cargos. Se establece en 1 si no se ejecuta ninguna tarea ni ningún trabajo; en caso contrario, se establece en 0. Este valor se comprueba a intervalos de cinco minutos, y un valor de 1 indica que el clúster estaba inactivo cuando se comprobó, no que estuvo inactivo durante los cinco minutos. Para evitar falsos positivos, debe activar una alarma cuando este valor sea 1 durante más de una comprobación consecutiva de cinco minutos. Por ejemplo, puede activar una alarma cuando este valor sea 1 durante treinta minutos o más.

Caso de uso: [EMPTY] clúster rendimiento

Unidades: Booleano

JobsRunning

El número de trabajos del clúster que se encuentran actualmente en ejecución.

Caso de uso: [EMPTY] clúster salud

Unidades: Count

JobsFailed

El número de trabajos del clúster que han producido un error.

Caso de uso: [EMPTY] clúster salud

Unidades: Count

Map/Reduce

MapTasksRunning

Número de tareas de asignación en ejecución de cada trabajo. Si tiene un programador instalado y varios trabajos en ejecución, se generan varios gráficos.

Caso de uso: [EMPTY] clúster progreso

Unidades: Count

MapTasksRemaining

Número de tareas de asignación pendientes de cada trabajo. Si tiene un programador instalado y varios trabajos en ejecución, se generan varios gráficos. Una tarea de asignación restante es aquella que no se encuentra en ninguno de los siguientes estados: Ejecutando, Descartado o Completado.

Caso de uso: [EMPTY] clúster progreso

Unidades: Count

MapSlotsOpen

La capacidad de la tarea de asignación no utilizada. Se calcula como el número máximo de tareas de asignación de un clúster determinado menos el número total de tareas de asignación que se están ejecutando actualmente en el clúster.

Caso de uso: Analizar clúster rendimiento

Unidades: Count

RemainingMapTasksPerSlot

La proporción entre el total de tareas de asignación pendientes y el total de slots de asignación disponibles en el clúster.

Caso de uso: Analizar clúster rendimiento

Unidades: Proporción

ReduceTasksRunning

Número de tareas de reducción en ejecución de cada trabajo. Si tiene un programador instalado y varios trabajos en ejecución, se generan varios gráficos.

Caso de uso: [EMPTY] clúster progreso

Unidades: Count

ReduceTasksRemaining

Número de tareas de reducción pendientes de cada trabajo. Si tiene un programador instalado y varios trabajos en ejecución, se generan varios gráficos.

Caso de uso: [EMPTY] clúster progreso

Unidades: Count

ReduceSlotsOpen

La capacidad de la tarea de reducción no utilizada. Se calcula como la capacidad máxima de la tarea de reducción de un clúster determinado menos el número de tareas de reducción que se están ejecutando actualmente en el clúster.

Caso de uso: Analizar clúster rendimiento

Unidades: Count

Estado del nodo

CoreNodesRunning

El número de nodos secundarios en funcionamiento. Los puntos de datos de esta métrica solo se registran cuando existe un grupo de instancias correspondiente.

Caso de uso: [EMPTY] clúster salud

Unidades: Count

CoreNodesPending

El número de nodos secundarios en espera de ser asignados. Puede que no todos los nodos secundarios solicitados estén disponibles inmediatamente; esta métrica registra las solicitudes pendientes. Los puntos de datos de esta métrica solo se registran cuando existe un grupo de instancias correspondiente.

Caso de uso: [EMPTY] clúster salud

Unidades: Count

LiveDataNodes

El porcentaje de nodos de datos que reciben trabajo de Hadoop.

Caso de uso: [EMPTY] clúster salud

Unidades: Porcentaje

TaskNodesRunning

El número de nodos de tareas en funcionamiento. Los puntos de datos de esta métrica solo se registran cuando existe un grupo de instancias correspondiente.

Caso de uso: [EMPTY] clúster salud

Unidades: Count

TaskNodesPending

El número de nodos de tareas en espera de ser asignados. Puede que no todos los nodos de tareas solicitados estén disponibles inmediatamente; esta métrica registra las solicitudes pendientes. Los puntos de datos de esta métrica solo se registran cuando existe un grupo de instancias correspondiente.

Caso de uso: [EMPTY] clúster salud

Unidades: Count

LiveTaskTrackers

El porcentaje de rastreadores de tareas que están operativos.

Caso de uso: [EMPTY] clúster salud

Unidades: Porcentaje

E/S

S3BytesWritten

El número de bytes escritos en Amazon S3. Esta métrica solo añade trabajos de MapReduce y no se aplica a otras cargas de trabajo de EMR.

Caso de uso: Analizar clúster rendimiento, Monitorización clúster progreso

Unidades: Count

S3BytesRead

El número de bytes leídos de Amazon S3. Esta métrica solo añade trabajos de MapReduce y no se aplica a otras cargas de trabajo de EMR.

Caso de uso: Analizar clúster rendimiento, Monitorización clúster progreso

Unidades: Count

HDFSUtilization

El porcentaje de almacenamiento HDFS usado actualmente.

Caso de uso: Analizar clúster rendimiento

Unidades: Porcentaje

HDFSBytesRead

El número de bytes leídos de HDFS.

Caso de uso: Analizar clúster rendimiento, Monitorización clúster progreso

Unidades: Count

HDFSBytesWritten

El número de bytes escritos en HDFS.

Caso de uso: Analizar clúster rendimiento, Monitorización clúster progreso

Unidades: Count

MissingBlocks

El número de bloques en los que HDFS no tiene réplicas. Pueden tratarse de bloques dañados.

Caso de uso: [EMPTY] clúster salud

Unidades: Count

TotalLoad

Número total actual de lectores y escritores registrados por todos los DataNodes de un clúster.

Caso de uso: Diagnostique el grado en el que una E/S alta podría contribuir a un rendimiento de ejecución de trabajo deficiente. Los nodos de procesos de trabajo que ejecutan el demonio DataNode también deben llevar a cabo tareas de mapeo y reducción. Valores sistemáticamente altos de TotalLoad durante un tiempo prolongado pueden indicar que un nivel elevado de E/S podría ser uno de los factores que está empeorando el rendimiento. Los picos ocasionales en este valor son normales y no necesariamente son indicativos de un problema.

Unidades: Count

HBase

BackupFailed

Si la última copia de seguridad produjo un error. Está establecido en 0 de forma predeterminada y se actualiza a 1 si el intento de copia de seguridad anterior produjo un error. Esta métrica solo se registra para los clústers HBase.

Caso de uso: Monitorizar copias de seguridad de HBase

Unidades: Count

MostRecentBackupDuration

La cantidad de tiempo que tarda en completarse la copia de seguridad anterior. Esta métrica se establece independientemente de si la última copia de seguridad se realizó correctamente o produjo un error. Mientras la copia de seguridad está en curso, esta métrica devuelve el número de minutos tras el inicio de la copia de seguridad. Esta métrica solo se registra para los clústers HBase.

Caso de uso: Monitorizar copias de seguridad de HBase

Unidades: Minutos

TimeSinceLastSuccessfulBackup

El número de minutos que han transcurrido desde que la última copia de seguridad de HBase correcta se inició en el clúster. Esta métrica solo se registra para los clústers HBase.

Caso de uso: Monitorizar copias de seguridad de HBase

Unidades: Minutos

Métricas de capacidad del clúster

Las siguientes métricas indican la capacidad actual o prevista de un clúster. Estas métricas solo están disponibles cuando el escalado administrado está habilitado. Para los clústeres compuestos de flotas de instancias, las métricas de capacidad del clúster se miden en Units. Para los clústeres compuestos por grupos de instancias, las métricas de capacidad del clúster se miden en Nodes o bien VCPU en función del tipo de unidad utilizado en la política de escalado administrada por. Para obtener más información, consulte Uso del escalado administrado por EMR en Amazon EMR en la Guía de administración de Amazon EMR.

Métrica ​Descripción
  • TotalUnitsRequested

  • TotalNodesRequested

  • TotalVCPURequested

El número total previsto de unidades, nodos o vCPU en un clúster según lo determine el escalado administrado.

Unidades: Count

  • TotalUnitsRunning

  • TotalNodesRunning

  • TotalVCPURunning

El número total actual de unidades, nodos o vCPU disponibles en un clúster en ejecución. Cuando se solicita un cambio de tamaño del clúster, esta métrica se actualizará después de agregar o quitar las nuevas instancias del clúster.

Unidades: Count

  • CoreUnitsRequested

  • CoreNodesRequested

  • CoreVCPURequested

El número previsto de unidades, nodos o vCPU CORE en un clúster según lo determine el escalado administrado.

Unidades: Count

  • CoreUnitsRunning

  • CoreNodesRunning

  • CoreVCPURunning

El número actual de unidades, nodos o vCPU CORE que se ejecutan en un clúster.

Unidades: Count

  • TaskUnitsRequested

  • TaskNodesRequested

  • TaskVCPURequested

El número previsto de unidades, nodos o vCPU TASK en un clúster según lo determine el escalado administrado.

Unidades: Count

  • TaskUnitsRunning

  • TaskNodesRunning

  • TaskVCPURunning

El número actual de unidades, nodos o vCPU TASK que se ejecutan en un clúster.

Unidades: Count

Dimensiones de las métricas de Amazon EMR

Los datos de Amazon EMR se pueden filtrar mediante alguna de las dimensiones de la tabla siguiente.

Dimensión ​Descripción
JobFlowId Lo mismo que clúster ID, que es el identificador único de un clúster con el formato j-XXXXXXXXXXXXX. Para encontrar este valor, haga clic en el botón clúster en la consola de Amazon EMR.
JobId El identificador de un trabajo de un clúster. Puede utilizarlo para filtrar las métricas devueltas desde un clúster hasta las que se aplican a un solo trabajo dentro del clúster. JobId tiene el formato job_XXXXXXXXXXXX_XXXX.