メニュー
Amazon CloudWatch
ユーザーガイド

Amazon CloudWatch アラームの作成

1 つのメトリクスを監視する CloudWatch アラームを作成できます。このアラームは、複数の期間にわたるしきい値とメトリクスの値の関係性に基づき、1 つ以上のアクションを実行します。アクションには、Amazon EC2 アクション、Auto Scaling アクション、または Amazon SNS トピックに送信される通知があります。

アラームは、持続している状態変化に対してのみアクションを呼び出します。CloudWatch アラームはそれが特定の状態にあるという理由だけではアクションを呼び出しません。アクションを呼び出すには、状態が変化し、その状態が特定の期間にわたって維持されている必要があります。

状態変化に伴いアラームによって呼び出されるアクションの内容は、そのアラームに関連付けられたアクションの種類によって異なります。Amazon EC2 アクションおよび Auto Scaling アクションの場合、アラームは、状態が変わり、その状態が持続している期間ごとにアクションを呼び出します。Amazon SNS 通知では、アクションが呼び出されるのは 1 回だけです。

注記

CloudWatch は、指定したアクションのテストや検証は行いません。また、存在しないアクションの呼び出しから生じる Auto Scaling や Amazon SNS のエラーも検出しません。アクションが存在していることを確認してください。

アラームはダッシュボードに追加することもできます。ダッシュボードにある場合、ALARM 状態になると、アラームは赤に変わるため、状態を事前にモニタリングしやすくなります。

アラームには次の 3 つの状態があります。

  • OK – メトリクスの値が、定義されたしきい値を下回っている。

  • ALARM – メトリクスの値が、定義されたしきい値を上回っている。

  • INSUFFICIENT_DATA – アラームが開始直後であるか、メトリクスが利用できないか、データが不足していてアラームの状態を判定できない。

下の図では、アラームのしきい値は 3 に、評価期間は 3 に設定されています。つまり、アラームは、3 つの連続した期間が超過している (値が 3 またはそれ以上) の場合にアクションを呼び出します。この図では、第 3 期間から第 5 期間にかけて発生しており、アラームの状態は ALARM になっています。第 6 期間で、値はしきい値を下回り、状態は OK に戻ります。後で、第 9 期間中のしきい値に再度超過がありますが、1 つの期間のみです。そのため、アラームの状態は OK のままです。

 アラームのしきい値によるアラームのトリガー

CloudWatch アラームの欠落データの処理の設定

各アラームが常に 3 つの状態のいずれかであるように、CloudWatch にレポートされるデータポイントはそれぞれ、次の 3 つのカテゴリのいずれかの状態に該当します。

  • good (しきい値の範囲内)

  • bad (しきい値に違反)

  • missing

アラームによる欠落データポイントの処理を指定できます。欠落データポイントの処理方法を選択します。

  • Missing (アラームは別のデータポイントを見つけられるように過去にさかのぼる)

  • Good (しきい値内のデータポイントとして処理される)

  • Bad (しきい値を超過しているデータポイントとして処理される)

  • Ignored (現在のアラーム状態が維持される)

最適な選択は、メトリクスの種類によって異なります。インスタンスの CPUUtilization など、継続的にデータを報告しているメトリクスの場合は、問題が発生していることを表すため、欠落データポイントは bad として処理します。ただし、Amazon DynamoDB の ThrottledRequests など、エラー発生時のみデータポイントを生成するメトリクスの場合は、good として欠落データを処理します。

アラームに最適なオプションを選択することで、アラームが、不要で誤解を招く状態に変更されることを防ぐだけでなく、システムの状態をさらに正確に表すことができます。

注記

欠落データを missing と処理し、現在のウィンドウのデータポイントの一部が欠落している場合、CloudWatch は、他の既存データポイントを探すために期間をさかのぼり、アラームの状態を変更するかどうかを評価します。この場合、検討中の一番過去の期間において超過していなければ、アラームの状態が ALARM に変更されることはありません。

パーセンタイルベースの CloudWatch アラームおよび少数のデータサンプル

アラームの統計としてパーセンタイルを設定すると、統計評価に使用する十分なデータがない場合の処理を指定することができます。そのまま統計を評価し、任意でアラームの状態を変更するように指定することもできます。また、サンプルサイズが小さい場合は、メトリクスを無視し、統計的に十分なデータが揃うまで評価を保留することもできます。

パーセンタイルが 0.5 から 1.00 の間の場合、この設定は、評価期間中にデータポイントが 10/(1- パーセンタイル) を下回ると使用されます。たとえば、この設定は、p99 パーセンタイルのアラームのサンプル数が 1000 を下回ると使用されます。パーセンタイルが 0 から 0.5 の間の場合、この設定は、データポイントが 10/パーセンタイル を下回ると使用されます。

CloudWatch アラームでよく使用する機能

次の機能は、すべての CloudWatch アラームに適用されます。

  • AWS アカウントにつき、リージョンごとに最大 5,000 の アラームを作成できます。アラームを作成または更新するには、PutMetricAlarm API アクション (mon-put-metric-alarm コマンド) を使用します。

  • DescribeAlarms (mon-describe-alarms) を使用して、現在設定しているアラームのいずれかまたはすべてを一覧表示したり、特定の状態にあるアラームを一覧表示したりできます。さらに、時間レンジで一覧をフィルタできます。

  • アラームを無効にするには DisableAlarmActions (mon-disable-alarm-actions) を、有効にするには EnableAlarmActions (mon-enable-alarm-actions) を使用します。

  • アラームの動作をテストするには、SetAlarmState (mon-set-alarm-state) を使用して任意の状態に設定します。この一時的な状態変更が持続するのは、次のアラーム比較が行われるときまでです。

  • カスタムメトリクスを作成する前に、PutMetricAlarm (mon-put-metric-alarm) を使用してアラームを作成できます。アラームを有効にするには、メトリクス名前空間およびメトリクス名に加えて、カスタムメトリクスのディメンションをすべてアラームの定義に含める必要があります。

  • アラームの履歴を見るには DescribeAlarmHistory (mon-describe-alarm-history) を使用します。CloudWatch は、アラーム履歴を 2 週間保存します。各状態変化に、固有のタイムスタンプが付きます。まれに、1 つの状態変化に対して複数の通知が履歴に残されることがあります。タイムスタンプによって、固有の状態変化を確認できます。

注記

特定の状況では、AWS リソースが CloudWatch にメトリクスデータを送信していないことがあります。

たとえば、Amazon EBS は、Amazon EC2 インスタンスに追加されていない利用可能なボリュームに関するメトリクスデータを送信しないことがあります。これは、そのボリュームでモニタリングするメトリクスの動作がないためです。そのようなメトリクスにアラームを設定すると、状態が Insufficient Data に変わることがあります。これは、単にリソースが動作していない状態を示すもので、必ずしも問題があることを意味しているわけではありません。

目次