Supervisar políticas de Data Lifecycle Manager con CloudWatch - Amazon EBS

Supervisar políticas de Data Lifecycle Manager con CloudWatch

Puede monitorear las políticas del ciclo de vida de Amazon Data Lifecycle Manager con Amazon CloudWatch, que recopila y procesa los datos sin procesar y los convierte en métricas legibles casi en tiempo real. Puede utilizar estas métricas para ver exactamente cuántas instantáneas de Amazon EBS y AMI basadas en EBS se crean, eliminan y copian en sus políticas a lo largo del tiempo. También puede establecer alarmas que vigilen determinados umbrales y enviar notificaciones o realizar acciones cuando se cumplan dichos umbrales.

Estas métricas se conservan durante un periodo de 15 meses, de forma que pueda tener acceso a información histórica y comprender mejor el desempeño de sus políticas de ciclo de vida durante un periodo prolongado.

Para obtener más información sobre Amazon CloudWatch, consulte la Guía del usuario de Amazon CloudWatch.

Métricas admitidas

El espacio de nombres de Data Lifecycle Manager incluye las siguientes métricas para las políticas de ciclo de vida de Amazon Data Lifecycle Manager. Las métricas admitidas difieren según el tipo de política.

Todas las métricas se pueden medir en la dimensión de DLMPolicyId. Las estadísticas más útiles son sum y average, y la unidad de medida es count.

Elija una pestaña para ver las métricas que admite ese tipo de política.

EBS snapshot policies
Métrica Descripción

ResourcesTargeted

Número de recursos a los que se destinan las etiquetas especificadas en una instantánea o una política de AMI basada en EBS.

SnapshotsCreateStarted

Número de acciones de creación de instantáneas iniciadas por una política de instantáneas. Cada acción se registra una sola vez, incluso si hay varios reintentos posteriores.

Si se produce un error en una acción de creación de instantáneas, Amazon Data Lifecycle Manager envía una métrica de SnapshotsCreateFailed.

SnapshotsCreateCompleted

Número de instantáneas creadas por una política de instantáneas. Esto incluye reintentos exitosos dentro de los 60 minutos de la hora programada.

SnapshotsCreateFailed

Número de instantáneas que no se pudieron crear mediante una política de instantáneas. Esto incluye reintentos fallidos en un plazo de 60 minutos a partir de la hora programada.

SnapshotsSharedCompleted

Número de instantáneas compartidas entre cuentas por una política de instantáneas.

SnapshotsDeleteCompleted

El número de instantáneas eliminadas por una instantánea o una política de AMI basada en EBS. Esta métrica se aplica únicamente a las instantáneas creadas por la política. No se aplica a las copias de instantáneas entre regiones creadas por la política.

Esta métrica incluye instantáneas que se eliminan cuando una política de AMI basada en EBS anula el registro de las AMI.

SnapshotsDeleteFailed

Número de instantáneas que no se pudieron eliminar mediante una instantánea o una política de AMI basada en EBS. Esta métrica se aplica únicamente a las instantáneas creadas por la política. No se aplica a las copias de instantáneas entre regiones creadas por la política.

Esta métrica incluye instantáneas que se eliminan cuando una política de AMI basada en EBS anula el registro de las AMI.

SnapshotsCopiedRegionStarted

Número de acciones de copia de instantáneas entre regiones iniciadas por una política de instantáneas.

SnapshotsCopiedRegionCompleted

Número de copias de instantáneas entre regiones creadas por una política de instantáneas. Esto incluye reintentos exitosos dentro de las 24 horas siguientes a la hora programada.

SnapshotsCopiedRegionFailed

Número de copias de instantáneas entre regiones que no se pudieron crear mediante una política de instantáneas. Esto incluye reintentos fallidos dentro de las 24 horas siguientes a la hora programada.

SnapshotsCopiedRegionDeleteCompleted

Número de copias de instantáneas entre regiones eliminadas, según la regla de retención, por una política de instantáneas.

SnapshotsCopiedRegionDeleteFailed

Número de copias de instantáneas entre regiones que no se pudieron eliminar, según lo designado por la regla de retención, por una política de instantáneas.

snapshotsArchiveDeletionFailed

El número de instantáneas archivadas que no se pudieron eliminar en el nivel de archivo mediante una política de instantáneas.

snapshotsArchiveScheduled

El número de instantáneas programadas para ser archivadas mediante una política de instantáneas.

snapshotsArchiveCompleted

El número de instantáneas archivadas de manera correcta mediante una política de instantáneas.

snapshotsArchiveFailed

El número de instantáneas que no se pudieron archivar mediante una política de instantáneas.

snapshotsArchiveDeletionCompleted

El número de instantáneas archivadas que se pudieron eliminar en el nivel de archivo correctamente mediante una política de instantáneas.

PreScriptStarted

El número de instancias para el que se inició correctamente un script previo.

Si los reintentos de scripts están habilitados, esta métrica se puede emitir varias veces por ejecución de la política.

PreScriptCompleted

El número de instancias para el que se completó correctamente un script previo. La métrica se emite incluso si el script previo se completa fuera del periodo de espera especificado.

Si los reintentos de scripts están habilitados, esta métrica se puede emitir varias veces por ejecución de la política.

PreScriptFailed

El número de instancias para el que no se completó correctamente un script previo. La métrica se emite incluso si el script previo se completa fuera del periodo de espera especificado.

Si los reintentos de scripts están habilitados, esta métrica se puede emitir varias veces por ejecución de la política.

PostScriptStarted

El número de instancias para el que se inició correctamente un script posterior.

Si los reintentos de scripts están habilitados, esta métrica se puede emitir varias veces por ejecución de la política.

PostScriptCompleted

El número de instancias para el que se completó correctamente un script posterior. La métrica se emite incluso si el script posterior se completa fuera del periodo de espera especificado.

Si los reintentos de scripts están habilitados, esta métrica se puede emitir varias veces por ejecución de la política.

PostScriptFailed

El número de instancias con problemas para completar un script posterior. La métrica se emite incluso si el script posterior se completa fuera del periodo de espera especificado.

Si los reintentos de scripts están habilitados, esta métrica se puede emitir varias veces por ejecución de la política.

VSSBackupStarted

El número de instancias con una copia de seguridad de VSS iniciada correctamente.

Si los reintentos de scripts están habilitados, esta métrica se puede emitir varias veces por ejecución de la política.

VSSBackupCompleted

El número de instancias con una copia de seguridad de VSS completada correctamente. La métrica se emite incluso si la copia de seguridad de VSS se completa fuera del periodo de espera.

Si los reintentos de scripts están habilitados, esta métrica se puede emitir varias veces por ejecución de la política.

VSSBackupFailed

El número de instancias en las que una copia de seguridad de VSS no se ha completado correctamente. La métrica se emite incluso si la copia de seguridad de VSS se completa fuera del periodo de espera.

Si los reintentos de scripts están habilitados, esta métrica se puede emitir varias veces por ejecución de la política.

EBS-backed AMI policies

Las siguientes métricas se pueden utilizar con las políticas de AMI basadas en EBS:

Métrica Descripción

ResourcesTargeted

Número de recursos a los que se destinan las etiquetas especificadas en una instantánea o una política de AMI basada en EBS.

SnapshotsDeleteCompleted

El número de instantáneas eliminadas por una instantánea o una política de AMI basada en EBS. Esta métrica se aplica únicamente a las instantáneas creadas por la política. No se aplica a las copias de instantáneas entre regiones creadas por la política.

Esta métrica incluye instantáneas que se eliminan cuando una política de AMI basada en EBS anula el registro de las AMI.

SnapshotsDeleteFailed

Número de instantáneas que no se pudieron eliminar mediante una instantánea o una política de AMI basada en EBS. Esta métrica se aplica únicamente a las instantáneas creadas por la política. No se aplica a las copias de instantáneas entre regiones creadas por la política.

Esta métrica incluye instantáneas que se eliminan cuando una política de AMI basada en EBS anula el registro de las AMI.

SnapshotsCopiedRegionDeleteCompleted

Número de copias de instantáneas entre regiones eliminadas, según la regla de retención, por una política de instantáneas.

SnapshotsCopiedRegionDeleteFailed

Número de copias de instantáneas entre regiones que no se pudieron eliminar, según lo designado por la regla de retención, por una política de instantáneas.

ImagesCreateStarted

El número de acciones CreateImage iniciadas por una política de AMI basada en EBS.

ImagesCreateCompleted

El número de AMI creadas por una política de AMI basada en EBS.

ImagesCreateFailed

Número de AMI que no se pudieron crear mediante una política de AMI basada en EBS.

ImagesDeregisterCompleted

Número de AMI cuyo registro fue anulado por una política de AMI basada en EBS.

ImagesDeregisterFailed

Número de AMI cuyo registro no pudo ser anulado por una política de AMI basada en EBS.

ImagesCopiedRegionStarted

Número de acciones de copia entre regiones iniciadas por una política de AMI basada en EBS.

ImagesCopiedRegionCompleted

Número de copias de AMI entre regiones creadas por una política de AMI basada en EBS.

ImagesCopiedRegionFailed

Número de copias de AMI entre regiones que no se pudieron crear mediante una política de AMI basada en EBS.

ImagesCopiedRegionDeregisterCompleted

El número de copias de AMI entre regiones cuyo registro se ha anulado, según lo designado por la regla de retención, mediante una política de AMI basada en EBS.

ImagesCopiedRegionDeregisteredFailed

Número de copias de AMI entre regiones cuyo registro no se pudo anular, según lo designado por la regla de retención, mediante una política de AMI basada en EBS.

EnableImageDeprecationCompleted

El número de AMI marcadas como obsoletas por una política de AMI basada en EBS.

EnableImageDeprecationFailed

El número de AMI que no se pudieron marcar como obsoletas mediante una política de AMI basada en EBS.

EnableCopiedImageDeprecationCompleted

El número de copias de AMI entre regiones marcadas como obsoletas por una política de AMI basada en EBS.

EnableCopiedImageDeprecationFailed

El número de copias de AMI entre regiones que no se pudieron marcar como obsoletas mediante una política de AMI basada en EBS.

Cross-account copy event policies

Las siguientes métricas se pueden utilizar con políticas de eventos de copia entre cuentas:

Métrica Descripción

SnapshotsCopiedAccountStarted

El número de acciones de copia de instantáneas entre cuentas iniciadas por una política de eventos de copia entre cuentas.

SnapshotsCopiedAccountCompleted

El número de instantáneas copiadas de otra cuenta mediante una política de eventos de copia entre cuentas. Esto incluye reintentos exitosos dentro de las 24 horas siguientes a la hora programada.

SnapshotsCopiedAccountFailed

El número de instantáneas que una política de eventos de copia entre cuentas no pudo copiar de otra cuenta. Esto incluye reintentos fallidos dentro de las 24 horas de la hora programada.

SnapshotsCopiedAccountDeleteCompleted

Número de copias de instantáneas entre regiones eliminadas, según lo designado por la regla de retención, por una política de eventos de copia entre cuentas.

SnapshotsCopiedAccountDeleteFailed

Número de copias de instantáneas entre regiones que no se pudieron eliminar, según lo designado por la regla de retención, mediante una política de eventos de copia entre cuentas.

Ver métricas de CloudWatch para sus políticas

Puede utilizar la AWS Management Console o las herramientas de línea de comandos para enumerar las métricas que Amazon Data Lifecycle Manager envía a Amazon CloudWatch.

Amazon EC2 console
Para consultar las métricas mediante la consola de Amazon EC2
  1. Abra la consola de Amazon EC2 en https://console.aws.amazon.com/ec2/.

  2. En el panel de navegación, elija Lifecycle Manager (Administrador de ciclo de vida).

  3. Seleccione una política en la cuadrícula y, a continuación, elija la pestaña Monitoring (Monitoreo).

CloudWatch console
Para consultar las métricas desde la consola de Amazon CloudWatch
  1. Abra la consola de CloudWatch en https://console.aws.amazon.com/cloudwatch/.

  2. En el panel de navegación, seleccione Métricas.

  3. Seleccione el espacio de nombres de EBS y, a continuación, seleccione Métricas de Data Lifecycle Manager.

AWS CLI
Para enumerar todas las métricas disponibles para Amazon Data Lifecycle Manager,

Utilice el comando list-metrics:

$ C:\> aws cloudwatch list-metrics \ --namespace AWS/EBS
Para enumerar todas las métricas de una política específica,

Utilice el comando list-metrics y especifique la dimensión de DLMPolicyId.

$ C:\> aws cloudwatch list-metrics \ --namespace AWS/EBS \ --dimensions Name=DLMPolicyId,Value=policy-abcdef01234567890
Para presentar una métrica en todas las políticas,

Utilice el comando list-metrics y especifique la opción --metric-name.

$ C:\> aws cloudwatch list-metrics \ --namespace AWS/EBS \ --metric-name SnapshotsCreateCompleted

Métricas de gráficos para las políticas

Tras crear una política, puede abrir la consola de Amazon EC2 y ver los gráficos de monitoreo de la política en la pestaña Monitoring (Monitoreo). Cada gráfico se basa en una de las métricas de Amazon EC2 disponibles.

Se encuentran disponibles las siguientes métricas de gráficos:

  • Recursos de destino (basados en ResourcesTargeted)

  • Creación de instantáneas iniciada (basada en SnapshotsCreateStarted)

  • Creación de instantáneas completada (basada en SnapshotsCreateCompleted)

  • Error en la creación de instantáneas (basado en SnapshotsCreateFailed)

  • Compartición de instantáneas completada (basada en SnapshotsSharedCompleted)

  • Eliminación de instantáneas completada (basada en SnapshotsDeleteCompleted)

  • Error en la eliminación de instantáneas (basado en SnapshotsDeleteFailed)

  • Copia de instantáneas entre regiones iniciada (basada en SnapshotsCopiedRegionStarted)

  • Copia de instantáneas entre regiones completada (basada en SnapshotsCopiedRegionCompleted)

  • Error en la copia de instantáneas entre regiones (basada en SnapshotsCopiedRegionFailed)

  • Eliminación de copia de instantáneas entre regiones completada (basada en SnapshotsCopiedRegionDeleteCompleted)

  • Error en la eliminación de instantáneas entre regiones (basada en SnapshotsCopiedRegionDeleteFailed)

  • Copia de instantáneas entre cuentas iniciada (basada en SnapshotsCopiedAccountStarted)

  • Copia de instantáneas entre cuentas completada (basada en SnapshotsCopiedAccountCompleted)

  • Error en la copia de instantáneas entre cuentas (basada en SnapshotsCopiedAccountFailed)

  • Eliminación de copia de instantáneas entre cuentas completada (basada en SnapshotsCopiedAccountDeleteCompleted)

  • Error en la eliminación de instantáneas entre cuentas (basada en SnapshotsCopiedAccountDeleteFailed)

  • Creación de AMI iniciada (basada en ImagesCreateStarted)

  • Creación de AMI completada (basada en ImagesCreateCompleted)

  • Error en la creación de AMI (basado en ImagesCreateFailed)

  • Cancelación de registro de AMI completada (basada en ImagesDeregisterCompleted)

  • Error al cancelar el registro de AMI (basado en ImagesDeregisterFailed)

  • Copia de AMI entre regiones iniciada (basada en ImagesCopiedRegionStarted)

  • Copia de AMI entre regiones completada (basada en ImagesCopiedRegionCompleted)

  • Error en la copia de AMI entre regiones (basada en ImagesCopiedRegionFailed)

  • Cancelación de registro de copia de AMI entre regiones completada (basada en ImagesCopiedRegionDeregisterCompleted)

  • Error al cancelar el registro de copia de AMI entre regiones (basado en ImagesCopiedRegionDeregisteredFailed)

  • Habilitación de la obsolescencia de la AMI completada (basada en EnableImageDeprecationCompleted)

  • Error en la habilitación de la obsolescencia de la AMI (basada en EnableImageDeprecationFailed)

  • Habilitación de la obsolescencia de la copia entre regiones de la AMI completada (basada en EnableCopiedImageDeprecationCompleted)

  • Error en la habilitación de la obsolescencia de la copia entre regiones de la AMI (basada en EnableCopiedImageDeprecationFailed)

Crear una alarma de CloudWatch para una política

Puede crear una alarma de CloudWatch que monitoree métricas de CloudWatch para sus políticas. CloudWatch le enviará una notificación automáticamente cuando la métrica alcance un límite que haya especificado. Puede crear una alarma de CloudWatch mediante la consola de CloudWatch.

Para obtener más información sobre cómo crear alarmas de CloudWatch mediante la consola de CloudWatch, consulte la Guía del usuario de Amazon CloudWatch.

Ejemplos de casos de uso

A continuación, se muestran ejemplos de casos de uso:

Ejemplo 1: métrica ResourcesTargeted

Puede utilizar la métrica ResourcesTargeted para monitorear el número total de recursos a los que se dirige una política específica cada vez que se ejecuta. Esto permite activar una alarma cuando el número de recursos objetivo está por debajo o por encima de un umbral esperado.

Por ejemplo, si espera que su política diaria cree copias de seguridad de no más de 50 volúmenes, puede crear una alarma de que envíe una notificación de email cuando el sum para ResourcesTargeted sea mayor a 50 a lo largo de un periodo de 1 horas. De esta forma, puede asegurarse de que no se han creado instantáneas inesperadamente a partir de volúmenes etiquetados incorrectamente.

Puede utilizar uno de los siguientes comandos para crear esta alarma:

$ C:\> aws cloudwatch put-metric-alarm \ --alarm-name resource-targeted-monitor \ --alarm-description "Alarm when policy targets more than 50 resources" \ --metric-name ResourcesTargeted \ --namespace AWS/EBS \ --statistic Sum \ --period 3600 \ --threshold 50 \ --comparison-operator GreaterThanThreshold \ --dimensions "Name=DLMPolicyId,Value=policy_id" \ --evaluation-periods 1 \ --alarm-actions sns_topic_arn

Ejemplo 2: métrica SnapshotDeleteFailed

Puede utilizar la métrica SnapshotDeleteFailed para monitorear si hay errores al eliminar instantáneas según la regla de retención de instantáneas de la política.

Por ejemplo, si ha creado una política que debería eliminar instantáneas automáticamente cada doce horas, puede crear una alarma que notifique a su equipo de ingeniería cuando el sum de SnapshotDeletionFailed sea mayor que 0 a lo largo de un periodo de 1 hora. Esto podría ayudar a investigar la retención inadecuada de instantáneas y a garantizar que los costos de almacenamiento de información no aumenten a causa de instantáneas innecesarias.

Puede utilizar uno de los siguientes comandos para crear esta alarma:

$ C:\> aws cloudwatch put-metric-alarm \ --alarm-name snapshot-deletion-failed-monitor \ --alarm-description "Alarm when snapshot deletions fail" \ --metric-name SnapshotsDeleteFailed \ --namespace AWS/EBS \ --statistic Sum \ --period 3600 \ --threshold 0 \ --comparison-operator GreaterThanThreshold \ --dimensions "Name=DLMPolicyId,Value=policy_id" \ --evaluation-periods 1 \ --alarm-actions sns_topic_arn

Ejemplo 3: métrica SnapshotsCopiedRegionFailed

Utilice la métrica SnapshotsCopiedRegionFailed para identificar cuándo las políticas no pueden copiar instantáneas en otras regiones.

Por ejemplo, si la política copia instantáneas entre regiones diariamente, puede crear una alarma que envíe un SMS a su equipo de ingeniería cuando el sum de SnapshotCrossRegionCopyFailed sea mayor que 0 a lo largo de un periodo de 1 hora. Esto puede ser útil para comprobar si la política copió con éxito las instantáneas posteriores en el linaje.

Puede utilizar uno de los siguientes comandos para crear esta alarma:

$ C:\> aws cloudwatch put-metric-alarm \ --alarm-name snapshot-copy-region-failed-monitor \ --alarm-description "Alarm when snapshot copy fails" \ --metric-name SnapshotsCopiedRegionFailed \ --namespace AWS/EBS \ --statistic Sum \ --period 3600 \ --threshold 0 \ --comparison-operator GreaterThanThreshold \ --dimensions "Name=DLMPolicyId,Value=policy_id" \ --evaluation-periods 1 \ --alarm-actions sns_topic_arn

Administración de políticas que notifican acciones fallidas

A fin de obtener más información sobre lo que se debe hacer cuando una de las políticas informa un valor inesperado distinto de cero para una métrica de acción fallida, consulte ¿Qué debo hacer si Amazon Data Lifecycle Manager informa sobre acciones fallidas en las métricas de CloudWatch? AWS Centro de conocimientos.