Definições de estatísticas do CloudWatch - Amazon CloudWatch

Definições de estatísticas do CloudWatch

Estatísticas são agregações de dados de métrica ao longo de períodos especificados. Ao representar em grafos ou recuperar as estatísticas de uma métrica, especifique a propriedade Period (Período), como cinco minutos, usando-a para calcular cada valor estatístico. Por exemplo, se Period for cinco minutos, Sum será a soma de todos os valores de amostra coletados durante o período de cinco minutos, enquanto o Minimum será o menor valor coletado no período de cinco minutos.

O CloudWatch oferece suporte às estatísticas de métricas a seguir.

  • SampleCount é o número de pontos de dados no período.

  • Sum é a soma dos valores de todos os pontos de dados coletados no período.

  • Average (Média) é o valor de Sum/SampleCount durante o período especificado.

  • Minimum (Mínimo) é valor mais baixo observado durante o período especificado.

  • Maximum (Máximo) é valor mais alto observado durante o período especificado.

  • O Percentil (p) indica a posição relativa de um valor no conjunto de dados. Por exemplo, p95 é o 95.º percentil e significa que 95% dos dados desse período são inferiores a esse valor e 5% são superiores a esse valor. Percentis ajudam você a ter uma melhor compreensão da distribuição de seus dados de métrica.

  • Média aparada (TM) é a média de todos os valores que estão entre dois limites especificados. Os valores que ultrapassam os limites são ignorados quando a média é calculada. Defina os limites como um ou dois números entre 0 e 100, de até 10 casas decimais. Os números podem ser valores absolutos ou porcentagens. Por exemplo, tm90 calcula a média após a remoção dos 10% dos pontos de dados com os valores mais altos. TM (2%:98%) calcula a média depois de remover os 2% dos pontos de dados mais baixos e 2% dos pontos de dados mais altos. TM (150:1000) calcula a média depois de remover todos os pontos de dados que são menores ou iguais a 150 ou maiores que 1000.

  • Média interquartil (IQM) é a média aparada do intervalo interquartil, ou 50% do meio dos valores. É equivalente a TM (25%:75%).

  • A média winsorizada (WM) é semelhante à média aparada. Porém, com a média winsorizada, os valores que estão fora do limite não são ignorados, sendo considerados iguais ao valor na borda do limite apropriado. Após essa normalização, calcula-se a média. Defina os limites como um ou dois números entre 0 e 100, de até 10 casas decimais. Por exemplo, wm98 calcula a média enquanto trata os 2% dos valores mais altos para ser igual ao valor do 98.º percentil. WM (10%:90%) calcula a média enquanto trata os 10% dos pontos de dados mais altos como o valor do limite de 90%, e tratando os 10% dos pontos de dados mais baixoscomo o valor do limite de 10%.

  • A classificação de percentis (PR) é a porcentagem de valores que atendem a um limite fixo. Por exemplo, PR(:300) retorna a porcentagem de pontos de dados que têm um valor de 300 ou menos. PR (100:2000) retorna a porcentagem de pontos de dados que têm um valor entre 100 e 2000.

  • Contagem aparada (TC) é o número de pontos de dados no intervalo escolhido para uma estatística de média aparada. Por exemplo, tc90 retorna o número de pontos de dados que não incluem quaisquer pontos de dados que se enquadram nos 10% dos valores mais altos. A TC (0.005:0.030) retorna o número de pontos de dados com valores entre 0,005 (exclusive) e 0,030 (inclusive).

  • Soma aparada (TS) é a soma de valores de pontos de dados no intervalo escolhidos para uma estatística de média aparada. Equivale a (Média aparada) * (Contagem aparada). Por exemplo, tc90 retorna a soma de pontos de dados que não incluem quaisquer pontos de dados que se enquadram nos 10% dos valores mais altos. TS (80%:) retorna a soma dos valores dos pontos de dados, não incluindo quaisquer pontos de dados com valores entre os 80% mais baixos do intervalo de valores.

nota

Para média aparada, contagem aparada, soma aparada e média winsorizada, se você definir dois limites como valores fixos em vez de porcentagens, o cálculo incluirá valores iguais ao limite superior, mas não incluirá valores iguais ao limite inferior.

Sintaxe

Para média aparada, contagem aparada, soma aparada e média Winsorizada, aplicam-se as seguintes regras de sintaxe:

  • Usar parênteses com um ou dois números com sinais de porcentagem define os limites a serem usados como os valores no conjunto de dados que se enquadram entre os dois percentis especificados. Por exemplo, TM (10%:90%) usa apenas os valores entre os percentis 10 e 90. TM (:95%) usa os valores da extremidade mais baixa dos dados configurados até o 95.º percentil, ignorando os 5% dos pontos de dados com os valores mais altos.

  • Usar parênteses com um ou dois números sem sinais de porcentagem define os limites a serem usados como os valores no conjunto de dados que se enquadram entre os valores explícitos que você especificar. Por exemplo, TC (80:500) usa apenas os valores que estão entre 80 (exclusive) e 500 (inclusive). TC (:0,5) usa apenas os valores iguais a 0,5 ou menores.

  • O uso de um número sem parênteses calcula usando porcentagens, ignorando pontos de dados que são maiores do que o percentil especificado. Por exemplo, tm99 calcula a média enquanto ignora o 1% dos pontos de dados com o valor mais alto. É o mesmo que TM(:99%).

  • Média aparada, contagem aparada, soma aparada e média winsorizada podem ser abreviadas usando letras maiúsculas ao especificar um intervalo, como TM (5%:95%), TM (100:200) ou TM(:95%). Elas só podem ser abreviadas usando letras minúsculas quando você especifica apenas um número, como tm99.

Casos de uso das estatísticas

  • Trimmed mean (Média aparada) é mais útil para métricas com um tamanho de amostra grande, como latência de página da Web. Por exemplo, tm99 ignora valores aberrantes extremamente altos que poderiam resultar de problemas de rede ou erros humanos, para fornecer um número mais preciso para a latência média de solicitações típicas. Da mesma forma, TM(10%:) não considera os 10% de valores de latência mais baixos, como os resultantes de acertos de cache. E TM(10%:99%) exclui os dois tipos de valores aberrantes.

  • É recomendável manter o controle da contagem aparada sempre que você estiver usando média aparada, para garantir que o número de valores que estão sendo usados em seus cálculos médios aparados são suficientes para ser estatisticamente significativo.

  • A classificação de percentil permite que você coloque valores em “compartimentos” de intervalos, e é possível usar isso para criar manualmente um histograma. Para fazer isso, divida seus valores em vários compartimentos, como PR(:1), PR(1:5), PR(5:10) e PR(10:). Coloque cada um desses compartimentos em uma visualização como gráficos de barras, e você terá um histograma.

Percentis versus média aparada

Um percentil, como p99, e uma média aparada, como tm99, medem valores semelhantes, mas não idênticos. Tanto p99 como tm99 ignoram o 1% dos pontos de dados com os valores mais altos, que são considerados valores aberrantes. Depois disso, p99 é o valor máximo dos 99% restantes, enquanto tm99 é a média dos 99% restantes. Se você estiver observando a latência de solicitações da Web, p99 diz-lhe a pior experiência do cliente, ignorando valores aberrantes, enquanto tm99 informa a experiência média do cliente, ignorando valores aberrantes.

A média aparada é uma boa estatística de latência a observar para quem está procurando otimizar a experiência do cliente. Para criar alarmes sobre a latência, recomendamos usar uma estatística de percentil para receber alertas antecipadamente, caso haja um problema que leve a uma perda parcial de serviço.

Requisitos para usar percentis, média aparada e algumas outras estatísticas

O CloudWatch precisa dos pontos de dados brutos para calcular as seguintes estatísticas:

  • Percentis

  • Média aparada

  • Média interquartil

  • Média winsorizada

  • Soma aparada

  • Contagem aparada

  • Classificação por percentil

Se publicar dados para estatísticas personalizadas usando um conjunto de estatísticas em vez de dados brutos, você só poderá recuperar esses tipos de estatísticas para esses dados se uma das seguintes condições for verdadeira:

  • O valor SampleCount do conjunto de estatísticas é 1 e Min, Max e Sum são todos iguais.

  • Min e Max são iguais, e Sum é igual a Min multiplicado por SampleCount.

Os seguintes exemplos de produtos da AWS incluem métricas compatíveis com esses tipos de estatísticas.

  • API Gateway

  • Application Load Balancer

  • Amazon EC2

  • Elastic Load Balancing

  • Kinesis

  • Amazon RDS

Além disso, esse tipo de estatística não está disponível para métricas quando qualquer um dos valores de métrica são números negativos.