Definiciones de estadísticas de CloudWatch - Amazon CloudWatch

Definiciones de estadísticas de CloudWatch

Las estadísticas son agregaciones de datos de métricas correspondientes a periodos especificados. Cuando grafica o recupera las estadísticas para una métrica, especifique el Período de tiempo, por ejemplo, cinco minutos, que se utilizarán para calcular cada valor estadístico. Por ejemplo, si el Periodo (Período) es de cinco minutos, la Sum (Suma) es la suma de todos los valores de muestra recopilados durante el período de cinco minutos, mientras que el Minimum (Mínimo) es el valor más bajo recogido durante el período de cinco minutos.

CloudWatch es compatible con las siguientes estadísticas para métricas.

  • Recuento de muestras es el número de puntos de datos durante el período.

  • Sum (Suma) es la suma de los valores de todos los puntos de datos recopilados durante el período.

  • Promedio es el valor de Sum/SampleCount durante el período especificado.

  • Mínimo es el valor más bajo observado durante el período especificado.

  • Máximo es el valor más alto observado durante el período especificado.

  • Percentil (p) indica la posición relativa de un valor en un conjunto de datos. Por ejemplo, p95 es el percentile número 95 y significa que el 95 por ciento de los datos en el período está por debajo de este valor y el 5 por ciento de los datos está por encima del mismo. Los percentiles le ayudan a entender mejor la distribución de los datos de métricas.

  • Media recortada (TM) es la media de todos los valores que se encuentran entre dos límites especificados. Los valores fuera de los límites se ignoran cuando se calcula la media. Los límites se definen como uno o dos números entre 0 y 100, hasta con 10 decimales. Los números pueden ser valores absolutos o porcentajes. Por ejemplo, tm90 calcula el promedio después de eliminar el 10 % de los puntos de datos con los valores más altos. TM (2 %:98 %) calcula el promedio después de eliminar los puntos de datos más bajos del 2 % y los puntos de datos más altos del 2 %. TM (150:1000) calcula el promedio después de eliminar todos los puntos de datos que son inferiores o iguales a 150 o superiores a 1000.

  • Media semiintercuartil (IQM) es la media recortada del rango intercuartil o el 50 % de los valores. Equivale a TM (25 %:75 %).

  • Media winsorizada (WM) es similar a la media recortada. Sin embargo, con la media winsorizada, los valores que están fuera del límite no se ignoran, sino que se consideran iguales al valor en el borde del límite apropiado. Después de esta normalización, se calcula el promedio. Los contornos se definen como uno o dos números entre 0 y 100, con hasta 10 decimales. Por ejemplo, wm98 calcula el promedio mientras se trata el 2 % de los valores más altos para que sea igual al valor en el percentil número 98. WM (10 %:90 %) calcula el promedio mientras se trata el 10 % más alto de los puntos de datos como el valor del límite del 90 %, y se trata el 10 % más bajo de los puntos de datos como el valor del límite del 10 %.

  • Rango del percentil (PR) es el porcentaje de valores que cumplen un umbral fijo. Por ejemplo, PR (:300) devuelve el porcentaje de puntos de datos que tienen un valor de 300 o menos. PR (100:2000) devuelve el porcentaje de puntos de datos que tienen un valor entre 100 y 2000.

    El rango percentil es exclusivo en el límite inferior e inclusivo en el límite superior.

  • Recuento recortado (TC) es el número de puntos de datos en el rango elegido para una estadística media recortada. Por ejemplo, tc90 devuelve el número de puntos de datos sin incluir ningún punto de datos que se sitúe en el 10 % más alto de los valores. TC (0,005:0,030) devuelve el número de puntos de datos con valores entre 0,005 (exclusivo) y 0,030 (inclusive).

  • Suma recortada (TS) es la suma de los valores de los puntos de datos en un rango elegido para una estadística media recortada. Es equivalente a (Media recortada) * (Recuento recortado). Por ejemplo, ts90 devuelve la suma de los puntos de datos sin incluir los puntos de datos que se sitúan en el 10 % más alto de los valores. TS (80 %:) devuelve la suma de los valores de punto de datos, sin incluir ningún punto de datos con valores en el 80 % más bajo del rango de valores.

nota

Si para calcular la media recortada, el recuento recortado, la suma recortada y la media winsorizada define dos límites como valores fijos en lugar de porcentajes, el cálculo incluirá valores iguales al límite superior, pero no valores iguales al límite inferior.

Sintaxis

Para calcular la media recortada, el recuento recortado, la suma recortada y la media winsorizada, se aplican las siguientes reglas de sintaxis:

  • El uso de paréntesis con uno o dos números con signos de porcentaje define los límites que se utilizarán como los valores del conjunto de datos que se encuentran entre los dos percentiles especificados. Por ejemplo, TM (10 %:90 %) utiliza sólo los valores entre los percentiles número 10 y 90. TM (:95 %) utiliza los valores desde el extremo más bajo de los datos configurados hasta el percentil número 95, e ignora el 5 % de los puntos de datos con los valores más altos.

  • El uso de paréntesis con uno o dos números sin signos de porcentaje define los límites que se utilizarán como los valores del conjunto de datos que se encuentran entre los valores explícitos que especifique. Por ejemplo, TC (80:500) utiliza sólo los valores que están entre 80 (exclusivo) y 500 (inclusive). TC (:0,5) utiliza sólo los valores que equivalen a 0,5 o son inferiores.

  • El uso de un número sin paréntesis calcula con porcentajes, e ignora los puntos de datos que son superiores al percentil especificado. Por ejemplo, tm99 calcula la media mientras ignora el 1 % de los puntos de datos con el valor más alto. Es lo mismo que TM (:99 %).

  • La media recortada, el recuento recortado, la suma recortada y la media winsorizada se pueden abreviar con letras mayúsculas al especificar un rango, como TM (5 %:95 %), TM (100:200) o TM (:95 %). Solo se pueden abreviar con letras minúsculas cuando se especifica un número, por ejemplo, tm99.

Casos de uso de estadísticas

  • Media recortada es más útil para métricas con un tamaño de muestra grande, como la latencia de la página web. Por ejemplo, tm99 ignora los valores extremos altos atípicos que podrían ser el resultado de problemas de red o errores humanos, para dar un número más preciso para la latencia promedio de las solicitudes típicas. Del mismo modo, TM (10 %:) ignora el 10 % más bajo de los valores de latencia, como los resultantes de los aciertos de la caché. Y TM (10 %:99 %) excluye ambos tipos de valores atípicos. Se recomienda utilizar la media recortada para monitorizar la latencia.

  • Es una buena idea vigilar el recuento recortado cada vez que utilice la media recortada para asegurarse de que el número de valores que se utilizan en los cálculos de la media recortada sea suficiente para obtener un valor estadísticamente significativo.

  • El rango de percentiles le permite poner valores en ‘bins’ de rangos, lo que le permitirá usar esto para crear manualmente un histograma. Para ello, divida los valores en varios bins, como PR (:1), PR (1:5), PR (5:10), y PR (10:). Coloque cada uno de los bins en una visualización como gráficos de barras, y tendrá un histograma.

    El rango percentil es exclusivo en el límite inferior e inclusivo en el límite superior.

Percentiles versus media recortada

Un percentil, como p99, y una media recortada, como tm99, miden valores similares, pero no idénticos. Ambos, p99 y tm99, ignoran el 1 % de los puntos de datos con los valores más altos, que se consideran valores atípicos. Luego, p99 es el valor máximo del 99 % restante, mientras que tm99 es el promedio del 99 % restante. Si mira la latencia de las solicitudes web, p99 muestra la peor experiencia del cliente e ignora los valores atípicos, mientras que tm99 le indica la experiencia promedio del cliente e ignora los valores atípicos.

La media recortada es una buena estadística de latencia para ver si usted busca optimizar la experiencia del cliente.

Requisitos para usar percentiles, media recortada y algunas otras estadísticas

CloudWatch necesita puntos de datos sin procesar para calcular las siguientes estadísticas:

  • Percentiles

  • Media recortada

  • Media intercuartil

  • Media winsorizada

  • Suma recortada

  • Recuento recortado

  • Rango de percentiles

Si publica datos para obtener estadísticas personalizadas a través de un conjunto de estadísticas en lugar de datos sin procesar, solo puede recuperar estos tipos de estadísticas para estos datos si una de las siguientes condiciones es VERDADERA:

  • El valor de SampleCount del conjunto estadístico es 1 y el mínimo, el máximo y la suma son todos iguales.

  • El mínimo y el máximo son iguales y la suma es igual al mínimo multiplicado por SampleCount.

Los siguientes servicios de AWS incluyen métricas que admiten este tipo de estadísticas.

  • API Gateway

  • Application Load Balancer

  • Amazon EC2

  • Elastic Load Balancing

  • Kinesis

  • Amazon RDS

Además, estos tipos de estadísticas no están disponibles para las métricas cuando alguno de los valores de las métricas es un número negativo.