異常検出に基づいて CloudWatch アラームを作成する - Amazon CloudWatch

異常検出に基づいて CloudWatch アラームを作成する

CloudWatch の異常検出に基づいてアラームを作成できます。これにより、過去のメトリクスデータがマイニングされ、想定値のモデルが作成されます。予想される値では、メトリクスの一般的な時間単位、日単位、週単位のパターンを考慮します。

異常検出のしきい値を設定すると、CloudWatch は、このしきい値をモデルで使用して、メトリクスの「正常」な値の範囲を決定します。しきい値を高くするほど、「正常」な値の範囲が広がります。

アラームがトリガーされるのが、メトリック値が想定値帯を上回る場合、下回る場合、または上回るか下回った場合のいずれかを選択できます。

詳細については、「CloudWatch の異常検出の使用」を参照してください。

注記

可視化目的で、メトリクスコンソールですでに異常検出を使用しているメトリクスに異常検出アラームを作成する場合、アラームに設定したしきい値は、すでに可視化に使用されているしきい値を変更しません。詳細については、「グラフの作成」を参照してください。

異常検出に基づいてアラームを作成するには

  1. https://console.aws.amazon.com/cloudwatch/ にある CloudWatch コンソールを開きます。

  2. ナビゲーションペインで、[Alarms]、[Create Alarm] の順に選択します。

  3. [メトリクスの選択] を選択し、以下のいずれかの操作を行います。

    • 必要なメトリクスが含まれているサービス名前空間を選択します。選択肢を絞り込むには、表示されるオプションを選択し続けます。メトリクスのリストが表示されたら、必要なメトリクスの横にあるチェックボックスをオンにします。

    • 検索ボックスに、メトリクス、ディメンション、またはリソース ID の名前を入力し、Enter キーを押します。次に、結果のいずれかを選択する操作を続けて、メトリクスを一覧表示します。必要なメトリクスの横にあるチェックボックスをオンにします。

  4. [グラフ化したメトリクス] タブを選択します。

    1. [統計] で、統計や事前定義済みパーセンタイルのいずれかを選択するか、カスタムパーセンタイル (p95.45 など) を指定します。

    2. [期間] で、アラームの評価期間を選択します。アラームを評価する場合、各期間は 1 つのデータポイントに集約されます。異常検出のアラームの場合、値は 1 分以上である必要があります。

      アラームの作成時に Y 軸の凡例を左側または右側に表示するかを選択することもできます。この設定が使用されるのは、アラームの作成時のみです。

    3. [メトリクスの選択] を選択します。

      [Specify metric and conditions (メトリクスと条件の指定)] ページに、選択したメトリクスと統計のグラフや他の情報が表示されます。

  5. Conditions (条件)] で、次のように指定します。

    1. [異常検出] を選択します。

      このメトリクスと統計のモデルがすでに存在する場合、CloudWatch では、画面上部のサンプルグラフに異常検出帯が表示されます。モデルがまだ存在しない場合は、アラームの作成を完了したときにこのモデルが生成されます。モデルによって生成された実際の異常検出バンドがグラフに表示されるまでに最大 15 分かかります。その前に表示されるバンドは異常検出バンドの近似値です。グラフを表示する時間枠を長くするには、ページの右上にある [編集] を選択します。

    2. [メトリクスが次の時] で、アラームをトリガーするための条件として、メトリクスがバンドを超えているか、下回っているか、または (いずれかの方向に) 外れているかを指定します。

    3. [Anomaly detection threshold (異常検出のしきい値)] で、異常検出のしきい値に使用する数値を選択します。数値を高くするほど、「正常」な値の範囲が広がり、メトリクスのより大きな変動が許容されます。数値を低くするほど、範囲が狭くなり、メトリクスのより小さい変動で ALARM 状態に移動するようになります。数値を整数にする必要はありません。

    4. [Additional configuration (追加設定)] を選択します。[Datapoints to alarm (アラームを発生させるデータポイント数)] で、アラームをトリガーするために ALARM 状態を維持する必要がある評価期間 (データポイント) の数を指定します。2 つの値が一致する場合は、該当する数の連続した期間でしきい値を超過したときに ALARM 状態に移行するアラームを作成します。

      N 個中 M 個のアラームを作成するには、2 番目の値よりも小さい数字を最初の値に指定します。詳細については、「アラームを評価する」を参照してください。

    5. [Missing data treatment (欠落データの処理)] 、一部のデータポイントが欠落しているときのアラームによる対処方法を選択します。詳細については、「CloudWatch アラームによる欠落データの処理方法の設定」を参照してください。

    6. モニタリングする統計としてパーセンタイルをアラームで使用している場合は、[サンプル数が少ないパーセンタイル] ボックスが表示されます。これを使用して、サンプル数が少ないケースを評価するか無視するかを選択します。[無視 (アラーム状態を維持する)] を選択すると、サンプル数が少なすぎる場合でも現在のアラーム状態が常に維持されます。詳細については、「パーセンタイルベースの CloudWatch アラームおよび少数のデータサンプル」を参照してください。

  6. [次へ] を選択します。

  7. [通知] で、アラームが ALARM 状態、OK 状態、または INSUFFICIENT_DATA 状態のときに通知するための SNS トピックを選択します。

    同じアラーム状態または複数の異なるアラーム状態について複数の通知を送信するには、[Add notification (通知の追加)] を選択します。

    アラームの通知を送信しない場合は、 [削除] を選択します。

  8. アラームに伴って EC2 アクションを実行するには、該当するボタンを選択し、アラーム状態および実行するアクションを選択します。

  9. 完了したら、[次へ] を選択します。

  10. アラームの名前と説明を入力します。名前には ASCII 文字のみを使用します。続いて、[次へ] を選択します。

  11. [Preview and create (プレビューして作成)] で、情報と条件が正しいことを確認し、アラームの作成] を選択します。

異常検出モデルを変更する

アラームを作成したら、異常検出モデルを調整できます。モデルの作成に使用しない特定の期間を除外できます。システムの停止、デプロイ、休日などの異常なイベントは、トレーニングデータから除外することが重要です。夏時間の変更に合わせてモデルを調整するかどうかも指定できます。

アラームの異常検出モデルを調整するには

  1. https://console.aws.amazon.com/cloudwatch/ にある CloudWatch コンソールを開きます。

  2. ナビゲーションペインで、[Alarms] を選択します。

  3. アラーム名を指定します。検索ボックスを使用し、必要に応じてアラームを見つけます。

  4. [View in metrics (メトリクスで表示)] を選択します。

  5. 画面の下部で、[Edit model (モデルを編集する)] を選択します。

  6. モデルの作成から期間を除外するには、[Add another time range to exclude from training (トレーニングから除外する別の時間範囲を追加)] を選択します。次に、トレーニングから除外する日付と時刻を選択または入力して、[適用] を選択します。

  7. メトリクスが、夏時間の変更に影響される場合は、[Metric timezone (メトリクスタイムゾーン)] ボックスで、適切なタイムゾーンを選択します。

  8. [Update (更新)] を選択します。

異常検出モデルを削除する

アラームに異常検出を使用すると、AWS 料金が発生します。アラームに異常検出モデルが不要になった場合は、アラームを削除し、その後でモデルを削除する必要があります。アラームを削除しないでモデルを削除すると、アラームによりモデルが自動的に再作成されます。

アラームを削除するには

  1. https://console.aws.amazon.com/cloudwatch/ にある CloudWatch コンソールを開きます。

  2. ナビゲーションペインで、[Alarms] を選択します。

  3. アラーム名を指定します。

  4. [ Actions] で、[Delete ] を選択します。

アラームに使用された異常検出モデルを削除するには

  1. https://console.aws.amazon.com/cloudwatch/ にある CloudWatch コンソールを開きます。

  2. ナビゲーションペインで メトリクスを選択します。

  3. [すべてのメトリクス] タブで、検索フィールドに検索語 (メトリクス名、リソース名など) を入力し、Enter キーを押します。

    たとえば、CPUUtilization メトリクスを検索した場合、そのメトリクスを持つ名前空間とディメンションが見つかります。

  4. 結果で、異常検出モデルがあったメトリクスを選択します。

  5. [グラフ化したメトリクス] タブを選択します。

  6. 画面の下部で、[Edit model (モデルを編集する)]、[モデルを削除する] の順に選択します。