As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.
Você pode monitorar suas políticas de ciclo de vida do Amazon Data Lifecycle Manager usando CloudWatch, que coleta dados brutos e os processa em métricas legíveis, quase em tempo real. Você pode usar essas métricas para ver exatamente quantos snapshots e snapshots do Amazon EBS baseados em EBS AMIs são criados, excluídos e copiados por suas políticas ao longo do tempo. Também é possível definir alarmes que observam determinados limites e enviam notificações ou realizam ações quando esses limites são atingidos.
As métricas ficam armazenadas por um período de 15 meses para que você possa acessar informações históricas e obter uma compreensão melhor sobre a performance de suas políticas de ciclo de vida em um período prolongado.
Para obter mais informações sobre a Amazon CloudWatch, consulte o Guia CloudWatch do usuário da Amazon.
Tópicos
Métricas compatíveis
O namespace do Data Lifecycle Manager
inclui as seguintes métricas das políticas de ciclo de vida do Amazon Data Lifecycle Manager. As métricas compatíveis diferem de acordo com o tipo de política.
Todas as métricas podem ser medidas na dimensão do DLMPolicyId
. As estatísticas mais úteis são sum
e average
, e a unidade de medida é count
.
Escolha uma guia para visualizar as métricas compatíveis com esse tipo de política.
Métrica | Descrição |
---|---|
|
O número de recursos de destino das tags especificadas em um snapshot ou política de AMI baseada no EBS. |
|
O número de ações de criação de snapshots iniciadas por uma política de snapshot. Toda ação é registrada apenas uma vez, mesmo que haja várias tentativas subsequentes. Se uma ação de criação de snapshots falhar, o Amazon Data Lifecycle Manager enviará uma métrica |
|
O número snapshots criados por uma política de snapshot. Inclui novas tentativas bem-sucedidas em até 60 minutos do horário agendado. |
|
O número snapshots que uma política de snapshot não conseguiu criar. Inclui novas tentativas malsucedidas em até 60 minutos do horário agendado. |
|
O número de de snapshots compartilhados entre contas por uma política de snapshot. |
|
O número de snapshots excluídos por um snapshot ou por uma política de AMI baseada no EBS. Essa métrica se aplica apenas aos snapshots criados pela política. Não se aplica a cópias de snapshots entre regiões criadas pela política. Essa métrica inclui instantâneos que são excluídos quando uma política de AMI apoiada pelo EBS é cancelada. AMIs |
|
O número de snapshots que o snapshot ou a política de AMI baseada no EBS não conseguiu excluir. Essa métrica se aplica apenas aos snapshots criados pela política. Não se aplica a cópias de snapshots entre regiões criadas pela política. Essa métrica inclui instantâneos que são excluídos quando uma política de AMI apoiada pelo EBS é cancelada. AMIs |
|
O número de ações de cópia de snapshots entre regiões iniciadas por uma política de snapshot. |
|
O número de ações de cópias de snapshots entre regiões criadas por uma política de snapshot. Inclui novas tentativas bem-sucedidas em até 24 horas do horário agendado. |
|
O número de cópias de snapshots entre regiões que não foi possível criar por meio de uma política de snapshot. Inclui tentativas malsucedidas num prazo de 24 horas a partir do horário agendado. |
|
O número de cópias de snapshots entre regiões excluídas, conforme designado pela regra de retenção, por uma política de snapshot. |
|
O número de cópias de snapshots entre regiões que não foi possível excluir, conforme designado pela regra de retenção, por meio de uma política de snapshot. |
|
O número de snapshots arquivados que o não puderam ser excluídos do nível de arquivamento por uma política de snapshot. |
|
O número de snapshots que foram programados para serem arquivados por uma política de snapshot. |
|
O número de snapshots que foram arquivados com sucesso por uma política de snapshot. |
|
O número snapshots que não puderam ser criados por uma política de snapshot. |
|
O número de snapshots arquivados que foram excluídos com sucesso do nível de arquivamento por uma política de snapshot. |
|
O número de instâncias em que um script prévio foi iniciado com sucesso. Se novas tentativas de script estiverem habilitadas, essa métrica poderá ser emitida várias vezes por execução de política. |
|
O número de instâncias em que um script prévio foi concluído com sucesso. A métrica é emitida mesmo que o script prévio seja concluído fora do período limite especificado. Se novas tentativas de script estiverem habilitadas, essa métrica poderá ser emitida várias vezes por execução de política. |
|
O número de instâncias em que um script prévio não foi concluído com sucesso. A métrica é emitida mesmo que o script prévio seja concluído fora do período limite especificado. Se novas tentativas de script estiverem habilitadas, essa métrica poderá ser emitida várias vezes por execução de política. |
|
O número de instâncias em que um script posterior foi iniciado com sucesso. Se novas tentativas de script estiverem habilitadas, essa métrica poderá ser emitida várias vezes por execução de política. |
PostScriptCompleted |
O número de instâncias em que um script posterior foi concluído com sucesso. A métrica é emitida mesmo que o script posterior seja concluído fora do período limite especificado. Se novas tentativas de script estiverem habilitadas, essa métrica poderá ser emitida várias vezes por execução de política. |
PostScriptFailed |
O número de instâncias em que um script posterior não foi concluído com sucesso. A métrica é emitida mesmo que o script posterior seja concluído fora do período limite especificado. Se novas tentativas de script estiverem habilitadas, essa métrica poderá ser emitida várias vezes por execução de política. |
|
O número de instâncias em que um script do VSS foi iniciado com sucesso. Se novas tentativas de script estiverem habilitadas, essa métrica poderá ser emitida várias vezes por execução de política. |
|
O número de instâncias em que um backup do VSS foi concluído com sucesso. A métrica é emitida mesmo que o backup do VSS seja concluído fora do período limite especificado. Se novas tentativas de script estiverem habilitadas, essa métrica poderá ser emitida várias vezes por execução de política. |
|
O número de instâncias em que um backup do VSS não foi concluído com sucesso. A métrica é emitida mesmo que o backup do VSS seja concluído fora do período limite especificado. Se novas tentativas de script estiverem habilitadas, essa métrica poderá ser emitida várias vezes por execução de política. |
Visualize CloudWatch métricas para suas políticas
Você pode usar as ferramentas AWS Management Console ou a linha de comando para listar as métricas que o Amazon Data Lifecycle Manager envia para a Amazon. CloudWatch
Para visualizar métricas usando o EC2 console da Amazon
-
Abra o EC2 console da Amazon em https://console.aws.amazon.com/ec2/
. -
No painel de navegação, escolha Gerenciador de ciclo de vida.
-
Selecione uma política na grade e, em seguida, escolha a guia Monitoramento.
Métricas de gráfico para suas políticas
Depois de criar uma política, você pode abrir o EC2 console da Amazon e visualizar os gráficos de monitoramento da política na guia Monitoramento. Cada gráfico é baseado em uma das EC2 métricas disponíveis da Amazon.
As métricas de gráficos a seguir estão disponíveis:
-
Recursos direcionados (com base em
ResourcesTargeted
) -
Criação de snapshots iniciada (com base em
SnapshotsCreateStarted
) -
Criação de snapshots concluída (com base em
SnapshotsCreateCompleted
) -
Falha na criação de snapshots (com base em
SnapshotsCreateFailed
) -
Compartilhamento de snapshots concluído (com base em
SnapshotsSharedCompleted
) -
Exclusão de snapshot concluída (com base em
SnapshotsDeleteCompleted
) -
Falha na exclusão de snapshots (com base em
SnapshotsDeleteFailed
) -
Cópia de snapshots entre regiões iniciada (com base em
SnapshotsCopiedRegionStarted
) -
Cópia de snapshots entre regiões concluída (com base em
SnapshotsCopiedRegionCompleted
) -
Falha na cópia de snapshots entre regiões (com base em
SnapshotsCopiedRegionFailed
) -
Exclusão da cópia de snapshots entre regiões concluída (com base em
SnapshotsCopiedRegionDeleteCompleted
) -
Falha na exclusão da cópia de snapshots entre regiões (com base em
SnapshotsCopiedRegionDeleteFailed
) -
Cópia de snapshots entre contas iniciada (com base em
SnapshotsCopiedAccountStarted
) -
Cópia de snapshots entre contas concluída (com base em
SnapshotsCopiedAccountCompleted
) -
Falha na cópia de snapshots entre contas (com base em
SnapshotsCopiedAccountFailed
) -
Exclusão de cópia de snapshots entre contas concluída (com base em
SnapshotsCopiedAccountDeleteCompleted
) -
Falha na exclusão de cópia de snapshots entre contas (com base em
SnapshotsCopiedAccountDeleteFailed
) -
Criação de AMI iniciada (com base em
ImagesCreateStarted
) -
Criação de AMI concluída (com base em
ImagesCreateCompleted
) -
Falha na criação de AMI (com base em
ImagesCreateFailed
) -
Cancelamento de registro de AMI concluído (com base em
ImagesDeregisterCompleted
) -
Falha no cancelamento do registro da AMI (com base em
ImagesDeregisterFailed
) -
Cópia de AMI entre regiões iniciada (com base em
ImagesCopiedRegionStarted
) -
Cópia de AMI entre regiões concluída (com base em
ImagesCopiedRegionCompleted
) -
Falha na cópia de AMI entre regiões (com base em
ImagesCopiedRegionFailed
) -
Cancelamento de registro de cópia de AMI entre regiões concluída (com base em
ImagesCopiedRegionDeregisterCompleted
) -
Falha no cancelamento de registro da cópia de AMI entre regiões (com base em
ImagesCopiedRegionDeregisteredFailed
) -
AMI para habilitar defasagem concluído (com base em
EnableImageDeprecationCompleted
) -
Falha na AMI para habilitar defasagem (com base em
EnableImageDeprecationFailed
) -
Cópia da AMI para habilitar defasagem entre regiões concluída (com base em
EnableCopiedImageDeprecationCompleted
) -
Falha na cópia da AMI para habilitar defasagem entre regiões (com base em
EnableCopiedImageDeprecationFailed
)
Criar um CloudWatch alarme para uma política
Você pode criar um CloudWatch alarme que monitore CloudWatch as métricas de suas políticas. CloudWatch enviará automaticamente uma notificação quando a métrica atingir um limite especificado por você. Você pode criar um CloudWatch alarme usando o CloudWatch console.
Para obter mais informações sobre a criação de alarmes usando o CloudWatch console, consulte o tópico a seguir no Guia do CloudWatch usuário da Amazon.
Exemplo de casos de uso
Veja a seguir exemplos de casos de uso:
Tópicos
Exemplo 1: ResourcesTargeted métrica
É possível usar a métrica ResourcesTargeted
para monitorar o número total de recursos de destino de uma política específica toda vez que ela é executada. Isso permite acionar um alarme quando o número de recursos de destino estiver abaixo ou acima do limite esperado.
Por exemplo, se você espera que sua política diária crie backups de não mais do que 50
volumes, é possível criar um alarme que envia uma notificação por e-mail quando a sum
de ResourcesTargeted
for maior que 50
pelo período de 1
hora. Dessa forma, é possível garantir que nenhum snapshot tenha sido criado inesperadamente de volumes que foram etiquetados de maneira incorreta.
É possível usar o seguinte comando para criar este alarme:
$
C:\>
aws cloudwatch put-metric-alarm \ --alarm-name resource-targeted-monitor \ --alarm-description "Alarm when policy targets more than 50 resources" \ --metric-name ResourcesTargeted \ --namespace AWS/EBS \ --statistic Sum \ --period 3600 \ --threshold 50 \ --comparison-operator GreaterThanThreshold \ --dimensions "Name=DLMPolicyId,Value=policy_id
" \ --evaluation-periods 1 \ --alarm-actionssns_topic_arn
Exemplo 2: SnapshotDeleteFailed métrica
É possível usar a métrica SnapshotDeleteFailed
para monitorar falhas na exclusão de snapshots, conforme a regra de retenção de snapshots da política.
Por exemplo, se você tiver criado uma política que deve excluir snapshots automaticamente a cada 12 horas, será possível criar um alarme que notifique sua equipe de engenharia quando a sum
de SnapshotDeletionFailed
for maior que 0
pelo período de 1
hora. Isso pode ajudar a averiguar a retenção incorreta de snapshots e a garantir que os custos de armazenamento não aumentem por causa de snapshots desnecessários.
É possível usar o seguinte comando para criar este alarme:
$
C:\>
aws cloudwatch put-metric-alarm \ --alarm-name snapshot-deletion-failed-monitor \ --alarm-description "Alarm when snapshot deletions fail" \ --metric-name SnapshotsDeleteFailed \ --namespace AWS/EBS \ --statistic Sum \ --period 3600 \ --threshold 0 \ --comparison-operator GreaterThanThreshold \ --dimensions "Name=DLMPolicyId,Value=policy_id
" \ --evaluation-periods 1 \ --alarm-actionssns_topic_arn
Exemplo 3: SnapshotsCopiedRegionFailed métrica
Use a métrica SnapshotsCopiedRegionFailed
para identificar quando suas políticas apresentam falha ao copiar snapshots para outras regiões.
Por exemplo, se sua política copia snapshots entre regiões diariamente, é possível criar um alarme que envia um SMS para sua equipe de engenharia quando a sum
de SnapshotCrossRegionCopyFailed
for maior que 0
pelo período de 1
hora. Isso pode ser útil para verificar se a política copiou corretamente os snapshots subsequentes na linhagem.
É possível usar o seguinte comando para criar este alarme:
$
C:\>
aws cloudwatch put-metric-alarm \ --alarm-name snapshot-copy-region-failed-monitor \ --alarm-description "Alarm when snapshot copy fails" \ --metric-name SnapshotsCopiedRegionFailed \ --namespace AWS/EBS \ --statistic Sum \ --period 3600 \ --threshold 0 \ --comparison-operator GreaterThanThreshold \ --dimensions "Name=DLMPolicyId,Value=policy_id
" \ --evaluation-periods 1 \ --alarm-actionssns_topic_arn
Gerenciamento de políticas que relatam ações com falha
Para obter mais informações sobre o que fazer quando uma de suas políticas relata um valor inesperado diferente de zero para uma métrica de ação falhada, consulte o artigo O que devo fazer se o Amazon Data Lifecycle Manager reportar