CloudWatch 統計定義 - Amazon CloudWatch

CloudWatch 統計定義

統計とは、メトリクスデータを指定した期間で集計したものです。メトリクスの統計をグラフ化または取得するときに、各統計値の計算に使用するPeriod (5 分など) を指定します。例えば、Periodが 5 分である場合、合計は 5 分間に収集されたすべてのサンプル値の合計です。一方、Minimumは、5 分期間中に収集された最小値です。

CloudWatch では、メトリクスの次の統計を使用できます。

  • SampleCount は、期間中のデータポイント数です。

  • Sum は、その期間中に収集されたすべてのデータポイントの値の合計です。

  • Average は、指定した期間の Sum/SampleCount の値です。

  • Minimum は、指定された期間に認められた最小値です。

  • Maximum は、指定された期間に認められた最大値です。

  • Percentile (p) は、データセットにおける値の相対的な位置を示します。例えば、p95 は 95 パーセンタイルであり、期間の 95 パーセントのデータがこの値を下回っており、5 パーセントのデータがこの値を上回っていることを意味します。パーセンタイルにより、メトリクスデータの分布をよく理解することができます。

  • Trimmed mean (TM) は、指定された 2 つの境界の間にあるすべての値の平均です。平均の計算時には、境界の外側の値は無視されます。境界は、0 ~ 100 の 1 つまたは 2 つの数値 (小数点以下 10 桁まで) で定義します。数値には、絶対値またはパーセンテージを指定できます。例えば、tm90 は、最も高い値を持つデータポイントの 10% を削除した後の平均を計算します。TM(2%:98%) は、最低 2% のデータポイントと最高 2% のデータポイントを削除した後の平均を計算します。TM(150:1000) は、150 以下、または 1000 以上のすべてのデータポイントを削除した後の平均を計算します。

  • Interquartile mean (IQM)四分位範囲のトリム平均、または値の中央の 50% です。これは、TM(25%:75%) に相当します。

  • Winsorized mean (WM) は、トリム平均に似ています。ただし、ウィンソライズされた平均値では、境界の外側にある値は無視されず、代わりに適切な境界のエッジにある値と等しいと見なされます。この正規化の後、平均が計算されます。境界は、0 ~ 100 の 1 つまたは 2 つの数値 (小数点以下 10 桁まで) で定義します。例えば、wm98 は、最高値の 2% を 98パーセンタイルの値と等しくなるように処理しながら、平均を計算します。WM(10%:90%) は、データポイントの最高 10% を 90% 境界の値として扱い、データポイントの最低 10% を 10% 境界の値として扱います。

  • Percentile rank (PR) は、固定しきい値を満たす値の割合です。例えば、PR(:300) は、300 以下の値を持つデータポイントの割合を返します。PR(100:2000) は、100 ~ 2000 の間の値を持つデータポイントの割合を返します。

    パーセンタイルランクは下限には含まれず、上限には含まれます。

  • Trimmed count (TC) は、トリミング平均統計の選択した範囲内のデータポイント数です。例えば、tc90 は、値の最高 10% に含まれるデータポイントを含まないデータポイントの数を返します。TC(0.005:0.030) は、0.005 (排他的) から 0.030 (包括的) の間の値を持つデータポイントの数を返します。

  • Trimmed sum (TS) は、トリミング平均統計の選択した範囲内のデータポイントの値の合計です。これは、(トリム平均値) * (トリム数) に相当します。例えば、ts90 は、値の最高 10% に含まれるデータポイントを含まないデータポイントの合計を返します。TS(80%:) は、データポイント値の合計を返します。値の範囲の最下位 80% の値を持つデータポイントは含まれません。

注記

Trimmed Mean、Trimmed Count、Trimmed Sum、および Winsorized Mean では、2 つの境界をパーセンテージではなく固定値として定義すると、計算には上側の境界に等しい値は含まれますが、下側の境界に等しい値は含まれません。

構文

Trimmed Mean、Trimmed Count、Trimmed Sum、および Winsorized Mean には、次の構文規則が適用されます。

  • 1 つまたは 2 つの数値にパーセント記号を付けた括弧を使用すると、指定した 2 つの百分位数の間にあるデータセット内の値として使用する境界が定義されます。例えば、TM(10%:90%) では、10 番目から 90 番目の百分位数の間の値のみが使用されます。TM(:95%) では、設定されたデータの最下端から 95 パーセンタイルまでの値が使用され、最も高い値を持つデータポイントの 5% は無視されます。

  • パーセント記号を付けずに 1 つまたは 2 つの数値に括弧を使用すると、指定した明示的な値の間に収まるデータセット内の値として使用する境界が定義されます。例えば、TC(80:500) は、80 (排他的) から 500 (包括的) の値のみを使用します。TC(:0.5) では、0.5 以下の値のみが使用されます。

  • 括弧を付けずに 1 つの数値を使用すると、指定した百分位数よりも大きいデータポイントは無視され、パーセンテージを使用して計算されます。例えば、tm99 は、最も高い値を持つデータポイントの 1% を無視して平均を計算します。これは、TM(:99%) と同じです。

  • Trimmed mean、Trimmed Count、Trimmed Sum、および Winsorized Mean は、範囲を指定するときに、すべて大文字を使用して省略できます。例えば、TM(5%:95%)TM (100:200)、またはTM(:95%) などです。例えば、tm99 など、数字を 1 つだけ指定する場合は、小文字のみを使用して省略できます。

統計ユースケース

  • Trimmed mean は、ウェブページのレイテンシーなど、大きなサンプルサイズのメトリクスで最も便利です。例えば、tm99 は、ネットワークの問題や人為的なエラーから生じる可能性のある極端に高い外れ値を無視し、一般的なリクエストの平均レイテンシーに対してより正確な数を与えます。同様に、TM(10%:) は、キャッシュヒットによるレイテンシー値など、レイテンシー値の最低 10% を無視します。そして、TM(10%:99%) は、こうしたタイプの外れ値の両方を除外します。レイテンシーのモニタリングには、トリミング平均を使用することをお勧めします。

  • トリミング平均を使用するときは常に、トリミングされたカウントを監視し、トリミングされた平均計算で使用される値の数が統計的に有意になるほど十分であることを確認することをお勧めします。

  • 百分位ランクを使用すると、値を範囲の「ビン」に入れることができ、これを使用して手動でヒストグラムを作成できます。これを行うには、値を PR(:1)PR(1:5)PR(5:10)、および PR(10:) などさまざまなビンに分割します。これらのビンのそれぞれを棒グラフとして可視化すると、ヒストグラムが得られます。

    パーセンタイルランクは下限には含まれず、上限には含まれます。

百分位数対トリミング平均

p99 などの百分位数および tm99 などのトリミングされた平均値は、類似しているが、同一ではない値を測定します。p99 および tm99 の両方は、外れ値と見なされる最も高い値を持つデータポイントの 1% を無視します。その後、p99 は残りの 99% の最大値となり、tm99 は残りの 99% の平均値となります。ウェブリクエストのレイテンシーを見ている場合は、p99 は、外れ値を無視して、最悪のカスタマーエクスペリエンスを示しますが、tm99 は、外れ値を無視して、平均的なカスタマーエクスペリエンスを示します。

Trimed mean は、カスタマーエクスペリエンスの最適化を検討しているかどうかを確認するのに適したレイテンシー統計です。

百分位数、調整平均値、およびその他の統計量を使用するための要件

CloudWatch は、以下の統計を計算するために、raw データポイントを必要とします。

  • パーセンタイル

  • トリム平均

  • 四分位平均

  • ウィンソライズ平均

  • トリム合計

  • トリム数

  • パーセンタイルランク

raw データの代わりに統計セットを使用してカスタム統計のデータを発行する場合は、以下の条件のいずれかが真である場合のみ、このデータのこれらのタイプの統計を取得できます。

  • 統計セットの SampleCount 値は 1 で、Min、Max、Sum はすべて等しくなります。

  • Min と Max は等しく、Sum は Min に SampleCount を乗算した値に等しくなります。

次の AWS サービスには、パーセンタイルこれらのタイプの統計をサポートするメトリクスが含まれています。

  • API Gateway

  • Application Load Balancer

  • Amazon EC2

  • Elastic Load Balancing

  • Kinesis

  • Amazon RDS

さらに、これらのタイプの統計は、メトリクス値が負の数値のメトリクスに対して使用することはできません。