アラートマネージャー - Amazon Managed Service for Prometheus

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

アラートマネージャー

Amazon Managed Service for Prometheus が実行するアラートルールが発動すると、送信されたアラートはアラートマネージャーによって処理されます。アラートマネージャーは、アラートの重複排除、グループ化、ダウンストリームのレシーバーへのルーティングを行います。Amazon Managed Service for Prometheus は、レシーバーとして Amazon Simple Notification Service のみをサポートし、同じアカウントの Amazon SNS トピックにメッセージをルーティングできます。アラートマネージャーを使用して、アラートを無音にしたり禁止したりすることもできます。

アラートマネージャーは、Prometheus の Alertmanager と同様の機能を提供します。

アラートマネージャーの設定ファイルを使用すると、次の機能を構成できます。

  • グループ化 - 類似するアラートを 1 つの通知にまとめます。これは特に、多数のシステムに同時に障害が発生し、大量のアラートが同時に発生する可能性のある大規模なシステム停止時に役立ちます。例えば、ネットワーク障害により、多くのノードに同時に障害が発生したとします。これらのタイプのアラートがグループ化されていると、アラートマネージャーが送信する通知は 1 つになります。

    アラートのグループ化とグループ化された通知のタイミングは、アラートマネージャー設定ファイルのルーティングツリーによって構成されます。詳細については、「<route>」を参照してください。

  • 禁止 - 他の特定のアラートが既に発動している場合に、特定のアラートの通知を抑制します。例えば、クラスターに到達できないというアラートが発動している場合に、そのクラスターに関する他のすべてのアラートをミュートするようにアラートマネージャーを構成できます。これにより、実際の問題とは関係のないアラートが大量に発生するのを防ぐことができます。禁止ルールの記述方法の詳細については、「<inhibit_rule>」を参照してください。

  • サイレンス - メンテナンスの時間帯など、指定した時間だけアラートをミュートします。受信したアラートに対して、アクティブなサイレンスのすべての等価式または正規表現マッチャーと一致するかどうかのチェックが行われます。一致した場合、そのアラートに関する通知は送信されません。

    サイレンスを作成するには、PutAlertManagerSilences API を使用します。詳細については、「PutAlertManagerSilences」を参照してください。

Prometheus テンプレート

スタンドアロンの Prometheus では、個別のテンプレートファイルを使用したテンプレート化がサポートされます。テンプレートでは、条件の使用、データのフォーマットど、さまざまな処理を行うことができます。

Amazon Managed Service for Prometheus の場合、テンプレートは、アラートマネージャーの設定を格納しているものと同じアラートマネージャー設定ファイルに追加します。