Conceitos do Amazon CloudWatch - Amazon CloudWatch

Conceitos do Amazon CloudWatch

Os seguintes conceitos e terminologia são fundamentais para o entendimento e uso do Amazon CloudWatch::

Para obter informações sobre as cotas de serviço para métricas, alarmes, solicitações de API e notificações por e-mail de alarmes do CloudWatch, consulte Cotas de serviço do CloudWatch.

Namespaces

Namespace é um contêiner para as métricas do CloudWatch. As métricas em namespaces diferentes são isoladas umas das outras, portanto, as métricas de aplicativos diferentes não são agregadas por engano nas mesmas estatísticas.

Não há um namespace padrão. Você deve especificar um namespace para cada ponto de dados que publicar no CloudWatch. Você pode especificar um nome de namespace ao criar uma métrica. Esses nomes devem conter caracteres ASCII válidos e ter 255 caracteres ou menos. Os caracteres passíveis de uso são: caracteres alfanuméricos (0-9, A-Z, a-z), ponto (.), hífen (-), sublinhado (_), barra (/), hash (#) e dois pontos (:) e o caractere de espaço. Um namespace deve conter pelo menos um caractere que não seja espaço em branco.

Os namespaces da AWS usam a seguinte convenção de nomenclatura: AWS/service. Por exemplo, o Amazon EC2 usa o namespace AWS/EC2. Para obter uma lista de namespaces da AWS, consulte Produtos da AWS que publicam métricas do CloudWatch.

Indicadores

As métricas são um conceito fundamental do CloudWatch. Uma métrica representa um conjunto de pontos de dados ordenados ao longo do tempo que são publicados no CloudWatch. Considere uma métrica como variável a ser monitorada, e os pontos de dados representando os valores dessa variável ao longo do tempo. Por exemplo, o uso de CPU de determinada instância do EC2 é uma métrica fornecida pelo Amazon EC2. Os pontos de dados em si podem ser provenientes de qualquer aplicativo ou atividade de negócios da qual você coleta dados.

Por padrão, muitos produtos da AWS fornecem métricas gratuitas para recursos (como instâncias do Amazon EC2, volumes do Amazon EBS e instâncias de banco de dados do Amazon RDS). Por uma taxa, você também pode habilitar o monitoramento detalhado de alguns recursos, como instâncias do Amazon EC2 ou publicar suas próprias métricas de aplicações. Para métricas personalizadas é possível adicionar os pontos de dados em qualquer ordem e em qualquer taxa que você escolher. É possível recuperar estatísticas sobre os pontos de dados como um conjunto ordenado de dados da série de tempo.

As métricas existem somente na Região em que são criadas. Não é possível excluir métricas, mas elas expirarão automaticamente depois de 15 meses se novos dados não forem publicados nelas. Os pontos de dados com mais de 15 meses expiram de forma contínua; à medida que novos pontos de dados são adicionados, os dados com mais de 15 meses são descartados.

As métricas são definidas exclusivamente por um nome, um namespace e zero ou mais dimensões. Cada ponto de dados em uma métrica tem um time stamp e (opcionalmente) uma unidade de medida. É possível recuperar estatísticas do CloudWatch de qualquer métrica.

Para obter mais informações, consulte Visualizar métricas disponíveis e Publicar métricas personalizadas do .

Carimbos de data/hora

Cada ponto de dados de métrica deve ser associado a um time stamp. O time stamp pode ser de até duas semanas no passado e até duas horas no futuro. Se você não fornecer um carimbo de data/hora, o CloudWatch criará um carimbo de data/hora para você com base no momento em que o ponto de dados foi recebido.

Os time stamps são objetos dateTime com a data completa além de horas, minutos e segundos (por exemplo, 2016-10-31T23:59:59 Z). Para obter mais informações, consulte dateTime. Embora não seja necessário, recomendamos que você use o Tempo Universal Coordenado (UTC). Quando você recupera estatísticas a partir do CloudWatch, todos os horários são exibidos em UTC.

Os alarmes do CloudWatch verificam as métricas com base na hora atual em UTC. As métricas personalizadas enviadas ao CloudWatch com carimbos de data/hora diferentes do horário UTC atual podem fazer com que os alarmes exibam o estado Dados insuficientes ou resultem em alarmes atrasados.

Retenção de métricas

O CloudWatch mantém os dados de métrica da seguinte forma:

  • Pontos de dados com um período inferior a 60 segundos ficam disponíveis por 3 horas. Estes pontos de dados são métricas personalizadas de alta resolução.

  • Pontos de dados com um período de 60 segundos (1 minuto) ficam disponíveis por 15 dias

  • Pontos de dados com um período de 300 segundos (5 minutos) ficam disponíveis por 63 dias

  • Pontos de dados com um período de 3.600 segundos (1 hora) ficam disponíveis por 455 dias (15 meses)

Os pontos de dados que inicialmente são publicados com um período menor são agregados para um armazenamento de longo prazo. Por exemplo, se você coletar dados usando um período de 1 minuto, os dados permanecerão disponíveis por 15 dias com resolução de 1 minuto. Depois de 15 dias estes dados ainda estarão disponíveis, mas estarão agregados e poderão ser recuperados apenas com uma resolução de 5 minutos. Depois de 63 dias, os dados estarão ainda mais agregados e disponíveis com uma resolução de 1 hora.

nota

AS métricas que não tiverem novos pontos de dados nas últimas duas semanas não serão exibidas no console. Elas também não serão exibidas quando você digitar o nome da métrica ou os nomes de dimensão na caixa de pesquisa na guia Todas as métricas do console e não serão retornadas nos resultados de um comando list-metrics. A melhor maneira de recuperar essas métricas é com os comandos get-metric-data ou get-metric-statistics na AWS CLI.

Dimensões

Uma dimensão é um par de nome/valor que faz parte da identidade de uma métrica. Você pode atribuir até 30 dimensões a uma métrica.

Cada métrica tem características específicas que a descrevem, e você pode considerar dimensões como categorias para essas características. Dimensões ajudam a projetar uma estrutura para seu plano de estatísticas. Como as dimensões fazem parte do identificador exclusivo de uma métrica, sempre que você adicionar um par de nome/valor exclusivo a uma de suas métricas, estará criando uma nova variação daquela métrica.

Produtos da AWS que enviam dados ao CloudWatch anexam dimensões a cada métrica. Você pode usar dimensões para filtrar os resultados que o CloudWatch retorna. Por exemplo, você pode obter estatísticas para uma determinada instância do EC2, especificando a InstanceId dimensão ao procurar métricas.

Para métricas produzidas por determinados produtos da AWS, como o Amazon EC2, o CloudWatch pode agregar dados entre dimensões. Por exemplo, se você procurar por métricas no namespace AWS/EC2, mas não especificar as dimensões, o CloudWatch agregará todos os dados da métrica especificada para criar a estatística que você solicitou. O CloudWatch não agrega suas métricas personalizadas entre as dimensões.

Combinações de dimensões

O CloudWatch trata cada combinação única de dimensões como uma métrica distinta, mesmo que as métricas tenham o mesmo nome. Você só pode recuperar estatísticas usando combinações de dimensões que publicou especificamente. Quando você recuperar estatísticas, especifique os mesmos valores para o namespace, nome da métrica e parâmetros de dimensão que foram usados quando as métricas foram criadas. Também é possível especificar os horários de início e de término para o CloudWatch usar na agregação.

Por exemplo, suponha que você publique quatro métricas distintas denominadas ServerStats no namespace DataCenterMetric com as seguintes propriedades:

Dimensions: Server=Prod, Domain=Frankfurt, Unit: Count, Timestamp: 2016-10-31T12:30:00Z, Value: 105 Dimensions: Server=Beta, Domain=Frankfurt, Unit: Count, Timestamp: 2016-10-31T12:31:00Z, Value: 115 Dimensions: Server=Prod, Domain=Rio, Unit: Count, Timestamp: 2016-10-31T12:32:00Z, Value: 95 Dimensions: Server=Beta, Domain=Rio, Unit: Count, Timestamp: 2016-10-31T12:33:00Z, Value: 97

Se você publicar somente quatro métricas, poderá recuperar as estatísticas para estas combinações de dimensões:

  • Server=Prod,Domain=Frankfurt

  • Server=Prod,Domain=Rio

  • Server=Beta,Domain=Frankfurt

  • Server=Beta,Domain=Rio

Não é possível recuperar estatísticas para as dimensões a seguir ou se você não especificar dimensões. (A exceção é usar a função matemática de métrica SEARCH que pode recuperar estatísticas para várias métricas. Para mais informações, consulte Usar expressões de pesquisa em gráficos.)

  • Server=Prod

  • Server=Beta

  • Domain=Frankfurt

  • Domain=Rio

Resolução

Cada métrica é um dos seguintes:

  • Resolução padrão, com dados de granularidade de um minuto

  • Resolução alta, com dados de granularidade de um segundo

Por padrão, as métricas produzidas por serviços da AWS têm resolução padrão. Quando você publica uma métrica personalizada, pode defini-la com resolução padrão ou alta. Quando você publica uma métrica de alta resolução, o CloudWatch a armazena com uma resolução de 1 segundo. Você pode ler e recuperar essa métrica no período de 1 segundo, 5 segundos, 10 segundos, 30 segundos ou em qualquer múltiplo de 60 segundos.

As métricas de alta resolução podem também dar a você insight mais imediato da atividade de subminuto da seu aplicativo. Lembre-se de que cada chamada PutMetricData de uma métrica personalizada é cobrada. Portanto, chamar PutMetricData com mais frequência em uma métrica de alta resolução pode resultar em tarifas mais altas. Para obter mais informações sobre os preços do CloudWatch, consulte Preço do Amazon CloudWatch.

Se você definir um alarme em uma métrica de alta resolução, pode especificar um alarme de alta resolução com um período de 10 ou 30 segundos ou pode definir um alarme regular com um período de qualquer múltiplo de 60 segundos. Há uma tarifa maior para alarmes de alta resolução com um período de 10 ou 30 segundos.

Estatísticas

Estatísticas são agregações de dados de métrica ao longo de períodos especificados. O CloudWatch fornece estatísticas com base nos pontos de dados de métrica fornecidos por seus dados personalizados ou por outros produtos da AWS para o CloudWatch. As agregações são feitas usando o namespace, o nome da métrica, as dimensões e a unidade de medida do ponto de dados no período especificado.

Para obter as definições detalhadas das estatísticas compatíveis com o CloudWatch, consulte Definições de estatísticas do CloudWatch.

Unidades

Cada estatística tem uma unidade de medida. Exemplo de unidades incluem Bytes, Seconds, Count e Percent. Para ver a lista completa das unidades compatíveis com o CloudWatch, consulte o tipo de dados MetricDatum na Referência da API do Amazon CloudWatch.

Você pode especificar uma unidade ao criar uma métrica personalizada. Se você não especificar uma unidade, o CloudWatch usará None como a unidade. Unidades ajudam a atribuir significado conceitual aos seus dados. Embora o CloudWatch não vincule nenhum significado a uma unidade internamente, outras aplicações podem extrair informações semânticas com base na unidade.

Os pontos de dados de métrica que especificam uma unidade de medida são agregados separadamente. Quando você obtém estatísticas sem especificar uma unidade, o CloudWatch agrega todos os pontos de dados da mesma unidade. Se você tiver duas métricas idênticas com unidades diferentes, dois streams de dados separados serão retornados, um para cada unidade.

Períodos

Período é o intervalo de tempo associado a uma determinada estatística do Amazon CloudWatch. Cada estatística representa uma agregação de dados de métricas coletados por um período especificado. Os períodos são definidos em número de segundos. Os valores válidos para o período são 1, 5, 10, 30 ou qualquer múltiplo de 60. Por exemplo, para especificar um período de seis minutos, use 360 como o valor do período. Você pode ajustar a forma como os dados são agregados alterando a duração do período. O valor padrão de um período é de 60 segundos. Um período pode ser tão curto quanto um segundo e deve ser um múltiplo de 60 se for maior que o valor padrão de 60 segundos.

Somente métricas personalizadas que você define com uma solução de armazenamento de 1 segundo oferece suporte aos períodos inferiores a um minuto. Embora a opção de definir um período abaixo de 60 esteja sempre disponível no console, você deve selecionar um período que alinha a forma como a métrica é armazenada. Para obter mais informações sobre as métricas que oferecem suporte a períodos com menos de um minuto, consulte Métricas de alta resolução.

Ao recuperar estatísticas, você pode especificar um período, os horários de início e de término. Esses parâmetros determinam o período geral associado às estatísticas. Os valores padrão para os horários de início e de término obtêm as estatísticas da última hora. Os valores que você especifica para os horários de início e de término determinam quantos períodos o CloudWatch retornará. Por exemplo, ao recuperar as estatísticas usando os valores padrão para o período, os horário de início e de término é retornado um conjunto agregado de estatísticas para cada minuto da hora anterior. Se você preferir estatísticas agregadas em blocos de 10 minutos, especifique um período de 600. Para estatísticas agregadas durante toda a hora, especifique um período de 3600.

Quando as estatísticas são agregadas ao longo de um período temporal, elas são marcadas com a hora correspondente ao início do período. Por exemplo, os dados agregados das 19h para às 20h são marcados como 19h. Além disso, os dados agregados entre 19h e 20h começam a ficar visíveis às 19h e, em seguida, os valores desses dados agregados podem alterar conforme o CloudWatch recolhe mais amostras durante o período.

Períodos também são importantes para os alarmes do CloudWatch. Ao criar um alarme para monitorar uma métrica específica, você solicita que o CloudWatch compare essa métrica ao valor de limite especificado. Você tem extenso controle sobre a forma como o CloudWatch faz essa comparação. Você pode especificar o período no qual a comparação é feita, mas você também pode especificar quantos períodos de avaliação são usados para chegar a uma conclusão. Por exemplo, se você especificar três períodos de avaliação, o CloudWatch comparará uma janela de três pontos de dados. O CloudWatch só notificará você se o ponto de dados mais antigo e os outros estiverem excedendo o limite ou estiverem ausentes.

Agregação

O Amazon CloudWatch agrega estatísticas de acordo com o período que você especifica ao recuperar estatísticas. Você pode publicar quantos pontos de dados quiser com carimbos de data/hora equivalentes ou semelhantes. O CloudWatch os agrega de acordo com o período especificado. O CloudWatch não agrega dados automaticamente entre regiões, mas é possível usar a matemática de métricas para agregar métricas de diferentes regiões.

Você pode publicar pontos de dados para uma métrica que compartilham não apenas o mesmo carimbo de data/hora, mas também o mesmo namespace e dimensões. O CloudWatch retorna estatísticas agregadas para esses pontos de dados. Você também pode publicar vários pontos de dados para as mesmas métricas ou métricas diferentes, com qualquer time stamp.

Para conjuntos de dados grandes, você pode inserir um conjunto de dados pré-agregados chamado conjunto de estatísticas. Com conjuntos de estatísticas, você atribui ao CloudWatch os valores Min, Max, Sum e SampleCount para vários pontos de dados. Isso é usado com frequência quando você precisa coletar dados muitas vezes em um minuto. Por exemplo, suponha que você tenha uma métrica para a latência de solicitação de uma página da web. Não faz sentido publicar dados com cada acesso à página da web. Sugerimos que você colete a latência de todos os acessos a essa página da Web, faça a agregação uma vez por minuto e envie esse conjunto de estatísticas para o CloudWatch.

O Amazon CloudWatch não diferencia a origem de uma métrica. Se você publicar uma métrica com o mesmo namespace e dimensões de origens diferentes, o CloudWatch a tratará como uma única métrica. Isso pode ser útil para as métricas de serviço em um sistema escalado e distribuído. Por exemplo, todos os hosts em uma aplicação de servidor da Web podem publicar métricas idênticas que representem a latência das solicitações em processamento. O CloudWatch as trata como uma única métrica, permitindo que você obtenha as estatísticas para os valores mínimo, máximo, médio e soma de todas as solicitações em sua aplicação.

Percentis

Um percentil indica a posição relativa de um valor no conjunto de dados. Por exemplo, o 95º percentil significa que 95% dos dados são inferiores a esse valor e 5% são superiores a esse valor. Percentis ajudam você a ter uma melhor compreensão da distribuição de seus dados de métrica.

Percentis geralmente são usados para isolar anomalias. Em uma distribuição normal, 95% dos dados ficam dentro de dois desvios padrão da média e 99,7% ficam dentro de três desvios padrão da média. Todos os dados que ficam fora dos três desvios padrão normalmente são considerados uma anomalia porque diferem de muito do valor médio. Por exemplo, suponha que você esteja monitorando a utilização da CPU de suas instâncias EC2 para garantir que seus clientes tenham uma boa experiência. Se você monitorar a média, isso poderá ocultar anomalias. Se você monitorar o máximo, uma única anomalia poderá se desviar dos resultados. Usando percentis, é possível monitorar o 95º percentil de utilização da CPU para verificar se há instâncias com uma carga pesada incomum.

Algumas métricas do CloudWatch oferecem suporte a percentis como estatística. Para essas métricas, você pode monitorar seu sistema e suas aplicações usando percentis da mesma forma que usaria as outras estatísticas do CloudWatch (Média, Mínimo, Máximo e Soma). Por exemplo, ao criar um alarme, você pode usar percentis como a função estatística. É possível especificar o percentil com até dez casas decimais (por exemplo, p95.0123456789).

Estatísticas de percentil estão disponíveis para métricas personalizadas, contanto que você publique os pontos de dados brutos e não resumidos para a métrica personalizada. As estatísticas de percentil não estão disponíveis para métricas quando qualquer um dos valores de métrica são números negativos.

O CloudWatch precisa dos pontos e dados brutos para calcular percentis. Se publicar dados usando um conjunto de estatísticas, você só poderá recuperar estatísticas de percentis para esses dados se uma das seguintes condições for verdadeira:

  • O valor SampleCount do conjunto de estatísticas é 1 e Min, Max e Sum são todos iguais.

  • Min e Max são iguais, e Sum é igual a Min multiplicado por SampleCount.

Os seguintes produtos da AWS incluem métricas compatíveis com estatísticas percentis.

  • API Gateway

  • Application Load Balancer

  • Amazon EC2

  • Elastic Load Balancing

  • Kinesis

  • Amazon RDS

O CloudWatch também é compatível com médias aparadas e outras estatísticas de performance, que podem ter um uso semelhante aos percentis. Para ter mais informações, consulte Definições de estatísticas do CloudWatch.

Alarmes

É possível usar um alarme para iniciar automaticamente ações em seu nome. Um alarme observa uma única métrica ao longo de um período especificado e realiza uma ou mais ações especificadas com base no valor da métrica em relação a um limite especificado ao longo do tempo. A ação é uma notificação enviada a um tópico do Amazon SNS ou a uma política de Auto Scaling. Você também pode adicionar alarmes aos painéis.

Os alertas invocam ações apenas para alterações de estado mantidas. Os alarmes do CloudWatch não invocam ações só porque estão em um determinado estado. O estado deve ter sido alterado e mantido por uma quantidade especificada de períodos.

Ao criar um alarme, selecione um período de monitoramento de alarme maior ou igual à resolução da métrica. Por exemplo, o monitoramento básico para o Amazon EC2 fornece métricas para suas instâncias a cada cinco minutos. Ao definir um alarme em uma métrica de monitoramento básico, selecione um período de, pelo menos, 300 segundos (5 minutos). O monitoramento detalhado para o Amazon EC2 fornece métricas para suas instâncias com uma resolução de 1 minuto. Ao definir um alarme em uma métrica de monitoramento detalhado, selecione um período de, pelo menos, 60 segundos (1 minuto).

Se você definir um alarme em uma métrica de alta resolução, pode especificar um alarme de alta resolução com um período de 10 ou 30 segundos ou pode definir um alarme regular com um período de qualquer múltiplo de 60 segundos. Há um custo maior para alarmes de alta resolução. Para obter mais informações sobre as métricas de alta resolução, consulte Publicar métricas personalizadas do .

Para obter mais informações, consulte Usar alarmes do Amazon CloudWatch e Criar um alarme a partir de uma métrica em um gráfico.