Utilice las CloudWatch métricas que se van a supervisar Elastic Graphics - Amazon Elastic Compute Cloud

Utilice las CloudWatch métricas que se van a supervisar Elastic Graphics

importante

Amazon Elastic Graphics llegó al final de su vida útil el 8 de enero de 2024. Para las cargas de trabajo que requieren aceleración de gráficos, le recomendamos usar instancias G4ad, G4dn o G5 de Amazon EC2.

Puede monitorizar su acelerador de Elastic Graphics mediante Amazon CloudWatch, que recopila métricas sobre el rendimiento de su acelerador. Estas estadísticas se registran durante un periodo de dos semanas, de forma que pueda tener acceso a información histórica y obtener una mejor perspectiva sobre el rendimiento de su servicio.

De forma predeterminada, los aceleradores de Elastic Graphics envían datos métricos a CloudWatch en periodos de 5 minutos.

Para obtener más información sobre Amazon CloudWatch, consulte la Guía del usuario de Amazon CloudWatch.

Métricas de Elastic Graphics

El espacio de nombres de AWS/ElasticGPUs incluye las siguientes métricas para Elastic Graphics.

Métrica Descripción

GPUConnectivityCheckFailed

Indica si la conectividad al acelerador Elastic Graphics está activa o ha producido un error. Un valor de cero (0) indica que la conexión está activa. Un valor de uno (1) indica un error de conexión.

Unidades: recuento

GPUHealthCheckFailed

Indica si el acelerador de Elastic Graphics ha superado una comprobación de estado en el último minuto. Un valor de cero (0) indica que se ha superado la comprobación de estado. Un valor de uno (1) indica que no se ha superado una comprobación de estado.

Unidades: recuento

GPUMemoryUtilization

La memoria de la GPU utilizada.

Unidades: MiB

Dimensiones de Elastic Graphics

Puede filtrar los datos de métricas para sus aceleradores de Elastic Graphics mediante las siguientes dimensiones.

Dimensión Descripción
EGPUId Filtra los datos por el acelerador de Elastic Graphics.
InstanceId Filtra los datos por la instancia a la que se asocia el acelerador de Elastic Graphics.

Ver métricas de CloudWatch para Elastic Graphics

Las métricas se agrupan en primer lugar por el espacio de nombres de servicio y, a continuación, por las dimensiones compatibles. Puede seguir los siguientes procedimientos para ver las métricas de sus aceleradores de Elastic Graphics.

Para consultar las métricas de Elastic Graphics mediante la consola de CloudWatch
  1. Abra la consola de CloudWatch en https://console.aws.amazon.com/cloudwatch/.

  2. Si es necesario, cambie la región. En la barra de navegación, seleccione la región donde reside su acelerador de Elastic Graphics. Para obtener más información, consulte Regiones y puntos de enlace.

  3. En el panel de navegación, seleccione Metrics (Métricas).

  4. En All metrics (Todas las métricas), seleccione Elastic Graphics y Elastic Graphics Metrics (Métricas de Elastic Graphics).

Para ver las métricas de Elastic Graphics (AWS CLI)

Utilice el siguiente comando list-metrics:

aws cloudwatch list-metrics --namespace "AWS/ElasticGPUs"

Crear alarmas de CloudWatch para supervisar Elastic Graphics

Puede crear una alarma de CloudWatch que envíe un mensaje de Amazon SNS cuando la alarma cambie de estado. Una alarma vigila una única métrica durante el período especificado y envía una notificación a un tema de Amazon SNS según el valor de la métrica relativo a un determinado umbral durante varios períodos de tiempo.

Por ejemplo, puede crear una alarma que monitorice el estado de un acelerador de Elastic Graphics y envíe una notificación cuando el acelerador de gráficos no supere una comprobación de estado durante tres periodos consecutivos de cinco minutos.

Para crear una alarma para un estado del acelerador de Elastic Graphics
  1. Abra la consola de CloudWatch en https://console.aws.amazon.com/cloudwatch/.

  2. En el panel de navegación, elija Alarms, Create Alarm.

  3. Elija Select metric (Seleccionar métrica), Elastic Graphics y Elastic Graphics Metrics (Métricas de Elastic Graphics).

  4. Seleccione la métrica GPUHealthCheckFailed y elija Select metric (Seleccionar métrica).

  5. Configure la alarma del modo siguiente:

    1. En Alarm details (Detalles de alarma), escriba un nombre y una descripción de la alarma. En Whenever (Siempre que), elija >= y escriba 1.

    2. En Actions (Acciones), seleccione una notificación existente o elija New list (Nueva lista).

    3. Elija Create Alarm.