CloudWatch définitions des statistiques - Amazon CloudWatch

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

CloudWatch définitions des statistiques

Les statistiques sont des regroupements de données de métrique sur une période donnée. Lorsque vous tracez ou récupérez les statistiques d'une métrique, vous spécifiez le paramètre Period (Période), par exemple cinq minutes, à utiliser pour calculer chaque valeur statistique. Par exemple, si le champ Period (Période) est cinq minutes, le champSum (Somme) est la somme de toutes les valeurs de l'échantillon recueillies au cours de la période de cinq minutes, tandis que le paramètre Minimum est la valeur la plus faible recueillie au cours de la période de cinq minutes.

CloudWatch prend en charge les statistiques suivantes pour les métriques.

  • SampleCountest le nombre de points de données au cours de la période.

  • Sum (Somme) est la somme des valeurs de tous les points de données collectés au cours de la période.

  • Average (Moyenne) est la valeur de Sum/SampleCount pendant la période spécifiée.

  • Minimum est la valeur la plus basse observée pendant la période spécifiée.

  • Maximum est la valeur la plus haute observée pendant la période spécifiée.

  • Percentile (p) (Centile [p]) indique la position relative d'une valeur dans un jeu de données. Par exemple, p95 est le 95e centile et signifie que 95 % les données de cette période sont inférieures à cette valeur et que 5 % des données lui sont supérieures. Les centiles vous permettent de mieux comprendre la distribution des données de vos métriques.

  • Trimmed mean (TM) (Moyenne ajustée [TM]) est la moyenne de toutes les valeurs situées entre deux limites spécifiées. Les valeurs en dehors des limites sont ignorées lorsque la moyenne est calculée. Vous définissez les limites comme un ou deux nombres compris entre 0 et 100, jusqu'à 10 décimales. Les nombres peuvent être des valeurs absolues ou des pourcentages. Par exemple, tm90 calcule la moyenne après avoir supprimé les 10 % des points de données avec les valeurs les plus élevées. TM(2 %:98 %) calcule la moyenne après avoir supprimé les 2 % de points de données les plus bas et les 2 % de points de données les plus élevés. TM(150:1000) calcule la moyenne après avoir supprimé tous les points de données inférieurs ou égaux à 150, ou supérieurs à 1 000.

  • Interquartile mean (IQM) (Moyenne interquartile [IQM]) est la moyenne ajustée de la plage interquartile, ou le milieu 50 % des valeurs. Elle est équivalente à TM(25 %:75 %).

  • Winsorized mean (WM) (Moyenne winsorisée [WM]) est similaire à la moyenne ajustée. Cependant, avec la moyenne winsorisée, les valeurs qui sont en dehors de la limite ne sont pas ignorées, mais sont considérées comme égales à la valeur au bord de la limite appropriée. Après cette normalisation, la moyenne est calculée. Vous définissez les limites comme un ou deux nombres compris entre 0 et 100, jusqu'à 10 décimales. Par exemple, wm98 calcule la moyenne tout en traitant les 2 % des valeurs les plus élevées pour être égal à la valeur au 98e percentile. WM(10 %:90 %) calcule la moyenne tout en traitant les 10 % les plus élevés des points de données comme étant la valeur de la limite de 90 %, et en traitant les 10 % les plus bas des points de données comme étant la valeur de la limite de 10 %.

  • Percentile rank (PR) (Rang centile [PR]) est le pourcentage de valeurs qui atteignent un seuil fixe. Par exemple, PR(:300) renvoie le pourcentage de points de données dont la valeur est inférieure ou égale à 300. PR(100:2000) renvoie le pourcentage de points de données dont la valeur est comprise entre 100 et 2 000.

    Le classement par percentile est exclusif dans la borne inférieure et inclusif dans la limite supérieure.

  • Trimmed count (Nombre ajusté [TC]) est le nombre de points de données dans la plage choisie pour une statistique moyenne ajustée. Par exemple, tc90 renvoie le nombre de points de données, sans compter les points de données qui se situent dans les 10 % les plus élevés des valeurs. TC(0,005:0,030) renvoie le nombre de points de données avec des valeurs comprises entre 0,005 (exclusif) et 0,030 (inclus).

  • Trimmed sum (Somme ajustée [TS]) est la somme des valeurs des points de données dans la plage choisie pour une statistique moyenne ajustée. Elle est équivalente à (Moyenne ajustée) * (Nombre ajusté). Par exemple, ts90 renvoie la somme des points de données, sans compter les points de données qui se situent dans les 10 % les plus élevés des valeurs. TS(80 %:) renvoie la somme des valeurs de point de données, sans compter les points de données dont les valeurs se situent dans les 80 % les plus bas de la plage de valeurs.

Note

Pour la moyenne ajustée, le nombre ajusté, la somme ajustée et la moyenne winsorisée, si vous définissez deux limites en tant que valeurs fixes au lieu de pourcentages, le calcul inclut des valeurs égales à la limite supérieure, mais n'inclut pas les valeurs égales à la limite inférieure.

Syntaxe

Pour la moyenne ajustée, le nombre ajusté, la somme ajustée et la moyenne winsorisée, les règles de syntaxe suivantes s'appliquent :

  • L'utilisation de parenthèses avec un ou deux nombres sans signe de pourcentage définit les limites à utiliser comme valeurs dans le jeu de données qui se trouvent entre les deux centiles que vous spécifiez. Par exemple, TM(10 %:90 %) utilise uniquement les valeurs comprises entre le 10e et le 90e centiles. TM(:95 %) utilise les valeurs de l'extrémité la plus basse des données définies jusqu'au 95e centile, en ignorant les 5 % des points de données avec les valeurs les plus élevées.

  • L'utilisation de parenthèses avec un ou deux nombres sans signe de pourcentage définit les limites à utiliser comme valeurs dans le jeu de données qui se trouvent entre les valeurs explicites que vous spécifiez. Par exemple, TC(80:500) utilise uniquement les valeurs comprises entre 80 (exclusive) et 500 (inclusive). TC(:0,5) utilise uniquement les valeurs qui sont égales ou inférieures à 0,5.

  • L'utilisation d'un nombre sans parenthèses calcule à l'aide de pourcentages, en ignorant les points de données supérieurs au centile spécifié. Par exemple, tm99 calcule la moyenne tout en ignorant 1 % des points de données avec la valeur la plus élevée. Il s'agit de la même valeur que TM(:99 %).

  • La moyenne ajustée, le nombre ajusté, la somme ajustée et la moyenne winsorisée peuvent toutes être abrégées à l'aide de lettres majuscules lors de la spécification d'une plage, telle que TM(5 %:95 %), TM(100:200) ou TM(:95 %). Ils ne peuvent être abrégés qu'en minuscules lorsque vous spécifiez un seul nombre, tel que tm99.

Cas d'utilisation des statistiques

  • Trimmed mean (Moyenne ajustée) est particulièrement utile pour les métriques ayant une taille d'échantillon importante, comme la latence de page Web. Par exemple, tm99 ne tient pas compte des valeurs aberrantes extrêmement élevées qui pourraient résulter de problèmes de réseau ou d'erreurs humaines, afin de donner un nombre plus précis pour la latence moyenne des requêtes typiques. De même, TM(10 %:)ne tient pas compte des 10 % les plus faibles des valeurs de latence, telles que celles résultant des accès au cache. Et TM(10 %:99 %) exclut ces deux types de valeurs aberrantes. Nous vous recommandons d'utiliser une moyenne ajustée pour surveiller la latence.

  • Il est conseillé de surveiller le nombre de valeurs ajustées chaque fois que vous utilisez la moyenne ajustée, pour vous assurer que le nombre de valeurs utilisées dans vos calculs de moyenne ajustée est suffisant pour être statistiquement significatif.

  • Le rang de centile vous permet de placer des valeurs dans des « casiers » de plages, et vous pouvez l'utiliser pour créer manuellement un histogramme. Pour ce faire, décomposez vos valeurs en plusieurs casiers, tels que PR(:1), PR(1:5), PR(5:10) et PR(10:). Placez chacun de ces casiers dans une visualisation sous forme de graphiques à barres, et vous obtenez un histogramme.

    Le classement par percentile est exclusif dans la borne inférieure et inclusif dans la limite supérieure.

Centiles par rapport à la moyenne ajustée

Un centile, tel que p99, et une moyenne ajustée, telle que tm99, mesurent des valeurs similaires, mais pas identiques. p99 et tm99 ignorent 1 % des points de données avec les valeurs les plus élevées, qui sont considérés comme des valeurs aberrantes. Puis, p99 est la valeur maximale des 99 % restants, tandis que tm99 est la moyenne des 99 % restants. Si vous regardez la latence des requêtes Web, p99 vous indique la pire expérience client, en ignorant les valeurs aberrantes, tandis que tm99 vous indique l'expérience client moyenne, en ignorant les valeurs aberrantes.

La moyenne ajustée est une bonne statistique de latence à surveiller si vous cherchez à optimiser votre expérience client.

Exigences relatives à l'utilisation de centiles, de la moyenne ajustée et d'autres statistiques

CloudWatch a besoin de points de données bruts pour calculer les statistiques suivantes :

  • Centiles

  • Moyenne ajustée

  • Moyenne interquartile

  • Moyenne winsorisée

  • Somme ajustée

  • Nombre ajustée

  • Rang de centile

Si vous publiez des données pour des statistiques personnalisées à l'aide d'un jeu de statistiques au lieu de données brutes, vous pouvez récupérer ces types de statistiques pour ces données uniquement si l'une des conditions suivantes est vraie :

  • La SampleCount valeur de l'ensemble de statistiques est 1 et Min, Max et Sum sont tous égaux.

  • Les valeurs Min et Max sont égales, et Sum est égale à Min multiplié par SampleCount.

Les AWS services suivants incluent des mesures qui prennent en charge ces types de statistiques.

  • API Gateway

  • Application Load Balancer

  • Amazon EC2

  • Elastic Load Balancing

  • Kinesis

  • Amazon RDS

De plus, ces types de statistiques sur les centiles ne sont pas disponibles pour les métriques lorsque l'une des valeurs des métriques est un nombre négatif.