Grafana マネージドアラートルールを設定する - Amazon Managed Grafana

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

Grafana マネージドアラートルールを設定する

このドキュメントトピックは、Grafana バージョン 10.x をサポートする Grafana ワークスペース向けに設計されています。

Grafana バージョン 9.x をサポートする Grafana ワークスペースについては、「」を参照してくださいGrafana バージョン 9 での作業

Grafana バージョン 8.x をサポートする Grafana ワークスペースについては、「」を参照してくださいGrafana バージョン 8 での作業

Grafana マネージドルールは、最も柔軟なアラートルールタイプです。これにより、サポートされている任意のデータソースからのデータに作用できるアラートを作成できます。複数のデータソースをサポートするだけでなく、式を追加してデータを変換し、アラート条件を設定することもできます。アラート通知でのイメージの使用もサポートされています。これは、1 つのルール定義で複数のデータソースからのアラートを許可する唯一のタイプのルールです。

1 つのアラートルール (多次元アラートとも呼ばれます) の結果として、複数のアラートインスタンスを作成できます。

Grafana マネージドアラートルールは、ルールを保存するフォルダの編集権限を持つユーザーのみが編集または削除できます。

UI で作成されたアラートリソースを削除すると、そのリソースを取得できなくなります。設定のバックアップを作成し、削除されたアラートリソースを復元できるようにするには、Terraform またはアラート API を使用してアラートリソースを作成します。

次の手順では、Grafana が管理するアラートルールを作成するプロセスについて説明します。

Grafana が管理するアラートルールを作成するには、ワークスペース内のアラート作成フローを使用して、以下のステップに従います。

アラートルール名の設定
  1. アラートと IRM -> アラートルール -> + 新しいアラートルール を選択します。

  2. アラートルールを識別する名前を入力します。

    この名前はアラートルールリストに表示されます。また、このルールから作成されるすべてのアラートインスタンスのalertnameラベルでもあります。

次に、測定するデータと、アラートルールが起動する前に満たす必要がある条件を取得するクエリを定義します。

クエリと条件を定義するには
  1. データソースを選択します。

  2. オプションドロップダウンから、時間範囲 を指定します。

    注記

    Grafana アラートは、 などの固定相対時間範囲のみをサポートしますnow-24hr: now

    絶対時間範囲 2021-12-02 00:00:00 to 2021-12-05 23:59:592または半相対時間範囲 はサポートされていませんnow/d to: now

  3. クエリを追加します。

    複数のクエリを追加するには、クエリの追加 を選択します。

    すべてのアラートルールは、デフォルトで Grafana によって管理されます。データソース管理のアラートルールに切り替える場合は、データソース管理のアラートルールに切り替える をクリックします。

  4. 1 つ以上のを追加します。

    1. 式ごとに Classic 条件を選択して単一のアラートルールを作成するか、数学削減再サンプリングのオプションから選択して、各シリーズに個別のアラートを生成します。

      注記

      Prometheus を使用する場合、インスタントベクトル関数と組み込み関数を使用できるため、式を追加する必要はありません。

    2. プレビュー を選択して、式が成功したことを確認します。

  5. 〔オプション] 復旧しきい値を追加するには、カスタム復旧しきい値の切り替えをオンにし、アラートルールが発動を停止するタイミングの値を入力します。

    クエリに追加できる復旧しきい値は 1 つだけで、アラート条件である必要があります。

  6. アラート条件として設定するクエリまたは式で、アラート条件として設定を選択します。

アラートルール評価を使用して、アラートルールを評価する頻度と、その状態を変更する速度を決定します。

これを行うには、アラートルールが正しい評価グループにあることを確認し、ユースケースに最適な保留期間を設定する必要があります。

アラート評価の動作を設定するには
  1. フォルダを選択するか、+ 新規フォルダ を選択します。

  2. 評価グループを選択するか、「新しい評価グループ」をクリックします。

    新しい評価グループを作成する場合は、グループの間隔を指定します。

    同じグループ内のすべてのルールは、同じ時間間隔で同時に評価されます。

  3. 保留期間を入力します。

    保留期間は、アラートルールが起動するまで条件に違反している可能性がある期間です。

    条件が満たされると、アラートは保留状態になります。指定された期間、条件がアクティブなままである場合、アラートは Firing 状態に移行し、アクティブでない場合は Normal 状態に戻ります。

  4. 必要に応じて、アラート通知の一時停止を有効にします。

    注記

    アラートルールの評価を一時停止して、アラートの調整中にノイズの多いアラートが発生しないようにします。一時停止すると、アラートルールの評価が停止し、アラートインスタンスは作成されません。これは、通知の配信を停止するミュートタイミングとは異なりますが、アラートルールの評価とアラートインスタンスの作成は可能です。

    アラートルールの評価を一時停止して、アラートの調整中にノイズの多いアラートを防ぐことができます。一時停止すると、アラートルールの評価が停止し、アラートインスタンスは作成されません。これは、通知の配信を停止するミュートタイミングとは異なりますが、アラートルールの評価とアラートインスタンスの作成は可能です。

  5. 「データとエラー処理なしの設定」で、データがない場合のアラート動作を設定します。

    このセクションで後述するガイドラインを使用してください。

アラートルールにラベルを追加して、発射アラートインスタンスを処理する通知ポリシーを設定します。

すべてのアラートルールとインスタンスは、ラベルに関係なく、デフォルトの通知ポリシーと一致します。ネストされたポリシーがない場合、またはアラートルールまたはアラートインスタンスのラベルに一致するネストされたポリシーがない場合、デフォルトの通知ポリシーは一致するポリシーになります。

通知を設定するには
  1. 通知のルーティング方法を変更する場合は、ラベルを追加します。

    ドロップダウンから既存のキーと値のペアを選択してカスタムラベルを追加するか、新しいキーまたは値を入力して新しいラベルを追加します。

  2. アラートインスタンスのルーティング設定をプレビューします。

    追加されたラベルに基づいて、アラートインスタンスは表示される通知ポリシーにルーティングされます。

    各通知ポリシーを展開して、詳細を表示します。

  3. 詳細を表示 を選択して、アラートルーティングの詳細とプレビューを表示します。

アラート通知メッセージでアラートに関するコンテキストをさらに提供するための注釈を追加します。

アノテーションはメタデータを追加して、アラート通知メッセージ内のアラートに関する詳細情報を提供します。例えば、概要アノテーションを追加して、アラートが起動した値や発生したサーバーを示します。

注釈を追加するには
  1. 〔オプション] 概要を追加します。

    何が起こったのか、その理由の簡単な概要。

  2. 〔オプション] 説明を追加します。

    アラートルールの動作の説明。

  3. 〔オプション] ランブック URL を追加します。

    アラートのランブックを保持するウェブページ

  4. 〔オプション] カスタム注釈を追加する

  5. 〔オプション] ダッシュボードとパネルリンクを追加します。

    アラートをダッシュボードのパネルにリンクします。

  6. [Save rule] (ルールを保存) を選択します。

単一および多次元ルール

Grafana マネージドアラートの場合、従来の条件を使用してルールを作成することも、多次元ルールを作成することもできます。

  • クラシック条件のルール

    クラシック条件式を使用して、条件が満たされたときに単一のアラートをトリガーするルールを作成します。複数のシリーズを返すクエリの場合、Grafana は各シリーズのアラート状態を追跡しません。その結果、複数のシリーズでアラート条件が満たされた場合でも、Grafana は 1 つのアラートのみを送信します。

  • 多次元ルール

    シリーズごとに個別のアラートを生成するには、多次元ルールを作成します。MathReduce、または Resample式を使用して多次元ルールを作成します。例:

    • 各クエリのReduce式を追加して、選択した時間範囲の値を 1 つの値に集計します (数値データ を使用するルールには必要ありません)。

    • ルールの条件を持つMath式を追加します。クエリまたは reduce 式がルールが発せられない0場合は を、発せられる場合は正の数値をすでに返す場合は必要ありません。例: B のクエリ/式が 70 を超える場合に $B > 70 を起動$B < $C * 100する場合。B の値が C の値に 100 を掛けた値より小さい場合に を起動する場合。比較されるクエリの結果に複数のシリーズがある場合、異なるクエリのシリーズが同じラベルを持っているか、一方が他のクエリのサブセットである場合、それらが一致されます。

注記

Grafana は、テンプレート変数を使用したアラートクエリをサポートしていません。詳細については、https://community.grafana.com/t/template-variables-are-not-supported-in-alert-queries-while-setting-up-alert/2514 を参照してください。

データおよびエラー処理を設定しない

アラートルールの評価でデータまたはエラーが返されない場合のアラート動作を設定します。

注記

評価がデータが返されない場合、またはエラーが発生した場合に起動するように設定されたアラートルールは、評価期間全体が終了した場合にのみ起動されます。つまり、アラートルール条件に違反したときにすぐに発せられるのではなく、アラートルールは For フィールドとして設定された時間が経過するまで待機してから発せられるため、アラートノイズが減少し、一時的なデータ可用性の問題が発生します。

アラートルールの評価でデータが返されない場合は、アラートルールの状態を次のように設定できます。

データなし 説明
データなし アラートルールの名前と UID、およびラベルとしてデータを返さないデータソースの UID DatasourceNoDataを含む新しいアラートを作成します。
アラート アラートルールの状態を に設定しますAlerting。アラートルールは、For フィールドで設定された時間が終わるまで待ってから発射します。
沖�� アラートルールの状態を に設定しますNormal

評価でエラーが返された場合は、アラートルールの状態を次のように設定できます。

エラー 説明
エラー アラートルールの名前と UID、およびラベルとしてデータを返さないデータソースの UID DatasourceErrorを持つアラートインスタンスを作成します。
アラート アラートルールの状態を に設定しますAlerting。アラートルールは、For フィールドで設定された時間が終わるまで待ってから発射します。
沖�� アラートルールの状態を に設定しますNormal

古いアラートインスタンスの解決

アラートインスタンスのディメンションまたはシリーズが 2 つの評価間隔でクエリ結果から完全に消えた場合、アラートインスタンスは古いと見なされます。

Alerting/NoData/Error 状態の古いアラートインスタンスは自動的に とマークResolvedされ、理由 でgrafana_state_reason注釈がアラートインスタンスに追加されますMissingSeries

パネルからアラートを作成する

任意のパネルタイプからアラートを作成します。つまり、パネル内のクエリを再利用し、それに基づいてアラートを作成できます。

  1. ダッシュボードセクションのダッシュボードに移動します。

  2. パネルの右上隅で、3 つのドット (楕円) を選択します。

  3. ドロップダウンメニューから、その他...を選択し、新しいアラートルール を選択します。

これによりアラートルールフォームが開き、現在のパネルのクエリに基づいてアラートを設定および作成できます。