概要 - Amazon Managed Grafana

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

概要

このドキュメントトピックは、Grafana バージョン 10.x をサポートする Grafana ワークスペース向けに設計されています。

Grafana バージョン 9.x をサポートする Grafana ワークスペースについては、「」を参照してくださいGrafana バージョン 9 での作業

Grafana バージョン 8.x をサポートする Grafana ワークスペースについては、「」を参照してくださいGrafana バージョン 8 での作業

始めたばかりのユーザーでも、Grafana アラートの経験豊富なユーザーでも、アラートの作成、管理、対応に役立つ基礎と利用可能な機能の詳細を確認し、問題を迅速に解決するチームの能力を向上させます。

原則

Prometheus ベースのアラートシステムでは、アラートを作成するアラートジェネレーターと、アラートを受信するアラートレシーバーがあります。例えば、Prometheus はアラートジェネレーターであり、アラートルールの評価を担当し、Alertmanager はアラートレシーバーであり、発音と解決されたアラートに関する通知のグループ化、禁止、サイレンシング、送信を担当します。

Grafana アラートは、アラートシステムを設計する Prometheus モデルに基づいて構築されています。アラートルールのスケジュールと評価を担当する内部アラートジェネレーターと、通知のグループ化、禁止、サイレンシング、送信を担当する内部アラートレシーバーがあります。Grafana は Prometheus をアラートジェネレーターとして使用しません。Grafana アラートは、Prometheus に加えて他の多くのデータソースと連携する必要があるためです。ただし、アラートのレシーバーとして Alertmanager を使用します。

アラートはアラートレシーバーに送信され、そこでルーティング、グループ化、禁止、無音、通知が行われます。Grafana アラートでは、デフォルトのアラートレシーバーは Grafana 内に埋め込まれたアラートマネージャーであり、Grafana アラートマネージャーと呼ばれます。ただし、他のアラートマネージャーを使用することもできます。これらは外部アラートマネージャー と呼ばれます。

基礎

以下に、Grafana アラートのさまざまな部分の概要を示します。

アラートルール

アラートルールは、アラートをいつ起動するかを決定する一連の基準です。これは、1 つ以上のクエリと式、満たす必要がある条件、アラートルールが評価される頻度を決定する間隔、アラートが発動するために条件が満たされる必要がある期間で構成されます。

アラートルールは間隔にわたって評価され、各アラートルールには一度に発せられるアラートが 0、1、または任意の数のアラートを設定できます。アラートルールの状態は、最もsevereアラートが多いことによって決まります。アラートルールは、通常、保留中、またはファイリングのいずれかです。例えば、アラートルールのアラートの少なくとも 1 つが発動している場合、アラートルールも発動します。アラートルールの状態は、最新の評価のステータスによって決まります。これらは、OK、エラー、および です NoData。

アラートルールの非常に重要な機能は、カスタム注釈とラベルをサポートすることです。これにより、概要や説明などの追加のメタデータを含むアラートを計測し、アラートを特定の通知ポリシーにルーティングするためのラベルを追加できます。

アラート

アラートは、ラベルと呼ばれるキーと値のペアのセットによって一意に識別されます。各キーはラベル名、各値はラベル値です。例えば、あるアラートに ラベルが付いfoo=barていて、別のアラートに ラベルが付いている場合などですfoo=baz。アラートには、 など多くのラベルを含めることができますfoo=bar,bar=bazが、 など同じラベルを 2 回持つことはできませんfoo=bar,foo=baz。2 つのアラートに同じラベルを付けることもできず、2 つのアラートに などの同じラベルがある場合foo=bar,bar=bazfoo=bar,bar=baz、アラートの 1 つが破棄されます。アラートは、アラートルールの条件が満たされなくなったとき、またはアラートルールが削除されたときに解決されます。

Grafana マネージドアラートでは、アラートの状態は、通常、保留中、アラート中、データなし、エラーのいずれかになります。Mimir や Loki などのデータソースのマネージドアラートでは、アラートは正常、保留中、アラートにすることができますが、 NoData または エラーにすることはできません。

連絡先

コンタクトポイントは、通知の送信先を決定します。例えば、E メールアドレス、Slack、Grafana OnCall や Pagerduty などのインシデント管理システム (IRM)、またはウェブフックに通知を送信する連絡先があるとします。

連絡先から送信される通知は、通知テンプレートを使用してカスタマイズできます。通知テンプレートを使用して、通知のタイトル、メッセージ、および構造を変更できます。通知テンプレートは、個々の統合や連絡先に固有ではありません。

通知ポリシー

通知ポリシーはアラートをグループ化し、それらを問い合わせポイントにルーティングします。通知が送信されるタイミングと、通知を繰り返す頻度を決定します。

アラートは、ラベルマッチャーを使用して通知ポリシーと一致します。これらは、アラートのラベルが正確に一致するか、完全に一致しないか、含まれていないか、または予想されるテキストの一部が含まれていないかをアサートする人間が読める式です。例えば、マッチャーはアラートを ラベルとfoo=bar照合foo=barし、マッチャーは正規表現 に一致する値を持つ foo という名前のラベルとアラートをfoo=~[a-zA-Z]+照合します[a-zA-Z]+

デフォルトでは、アラートは 1 つの通知ポリシーにのみ一致できます。ただし、continue機能アラートを使用すると、任意の数の通知ポリシーを同時に一致させることができます。通知ポリシーの詳細については、「通知ポリシー」を参照してください。

サイレンスとミュートのタイミング

無音とミュートのタイミングにより、特定のアラートの通知を一時停止したり、通知ポリシー全体を停止したりできます。サイレンスを使用して、メンテナンスウィンドウ中など、アドホックベースで通知を一時停止し、ミュートタイミングを使用して、夜間や週末など、一定の間隔で通知を一時停止します。