CloudWatch メトリクスを使用して Amazon Managed Service for Prometheus リソースをモニタリングする - Amazon Managed Service for Prometheus

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

CloudWatch メトリクスを使用して Amazon Managed Service for Prometheus リソースをモニタリングする

Amazon Managed Service for Prometheus は、使用状況メトリクスを に供給します CloudWatch。これらのメトリクスにより、ワークスペースの使用状況が可視化されます。提供されたメトリクスは、 の AWS/Usageおよび AWS/Prometheus名前空間にあります CloudWatch。これらのメトリクスは で CloudWatch無料で利用できます。使用状況メトリクスの詳細については、「 CloudWatch 使用状況メトリクス」を参照してください。

CloudWatch メトリクス名 リソース名 CloudWatch 名前空間 説明

ResourceCount

IngestionRate

AWS/Usage

サンプルの取り込みレート

単位: 1 秒あたりのカウント

有効な統計: Average、Minimum、Maximum、Sum

ResourceCount

ActiveSeries

AWS/Usage

ワークスペースごとのアクティブなシリーズの数

単位: 数

有効な統計: Average、Minimum、Maximum、Sum

ResourceCount

ActiveAlerts

AWS/Usage

ワークスペースごとのアクティブなアラートの数

単位: 数

有効な統計: Average、Minimum、Maximum、Sum

ResourceCount

SizeOfAlerts

AWS/Usage

ワークスペース内のすべてのアラートの合計サイズ、バイト単位

単位: バイト

有効な統計: Average、Minimum、Maximum、Sum

ResourceCount

SuppressedAlerts

AWS/Usage

ワークスペースごとの抑制状態にあるアラートの数。アラートは、無音や禁止にすることで抑制できます。

単位: 数

有効な統計: Average、Minimum、Maximum、Sum

ResourceCount

UnprocessedAlerts

AWS/Usage

ワークスペースごとの未処理状態のアラートの数。アラートは、 によって受信されると未処理の状態になりますが AlertManager、次の集約グループ評価を待っています。

単位: 数

有効な統計: Average、Minimum、Maximum、Sum

ResourceCount

AllAlerts

AWS/Usage

ワークスペースごとのすべての状態のアラート数。

単位: 数

有効な統計: Average、Minimum、Maximum、Sum

AlertManagerAlertsReceived

-

AWS/Prometheus

アラートマネージャーによって正常に受信されたアラートの合計数

単位: 数

有効な統計: Average、Minimum、Maximum、Sum

AlertManagerNotificationsFailed

-

AWS/Prometheus

失敗したアラート配信の数

単位: 数

有効な統計: Average、Minimum、Maximum、Sum

AlertManagerNotificationsThrottled

-

AWS/Prometheus

スロットリングされたアラートの数

単位: 数

有効な統計: Average、Minimum、Maximum、Sum

DiscardedSamples*

-

AWS/Prometheus

破棄されたサンプルの数 (理由別)

単位: 数

有効な統計: Average、Minimum、Maximum、Sum

RuleEvaluations

-

AWS/Prometheus

ルール評価の合計数

単位: 数

有効な統計: Average、Minimum、Maximum、Sum

RuleEvaluationFailures

-

AWS/Prometheus

特定の間隔におけるルール評価の失敗の数

単位: 数

有効な統計: Average、Minimum、Maximum、Sum

RuleGroupIterationsMissed

-

AWS/Prometheus

特定の間隔における欠落したルールグループイテレーションの数。

単位: 数

有効な統計: Average、Minimum、Maximum、Sum

* サンプルが破棄される理由には、次のようなものがあります。

理由

意味

greater_than_max_sample_age

1 時間以上経過したサンプルを破棄します。

new-value-for-timestamp

重複したサンプルは、以前に記録されたものとは異なるタイムスタンプで送信されます。

per_metric_series_limit

ユーザーがメトリクスあたりのアクティブなシリーズの制限に達しました。

per_user_series_limit

ユーザーがアクティブなシリーズ制限の合計数に達しました。

rate_limited

取り込みレートには制限があります。

sample-out-of-order

サンプルは順不同で送信され、処理できません。

label_value_too_long

ラベルの値が文字数の制限を超えています。

max_label_names_per_series

ユーザーがメトリクスあたりのラベル名に達しました。

missing_metric_name

メトリクス名が指定されていません。

metric_name_invalid

無効なメトリクス名が指定されました。

label_invalid

無効なラベルが指定されました。

duplicate_label_names

重複するラベル名が指定されました。

注記

メトリクスがない場合は、そのメトリクスの値が 0 であることと同じ意味になります。

注記

RuleGroupIterationsMissedRuleEvaluationsRuleEvaluationFailures には、次の構造の RuleGroup ディメンションがあります。

RuleGroupNamespace;RuleGroup

Prometheus が販売したメトリクスに CloudWatch アラームを設定する

CloudWatch アラームを使用して Prometheus リソースの使用状況をモニタリングできます。

Prometheus ActiveSeriesの の数にアラームを設定するには
  1. グラフ化されたメトリクスタブを選択し、ActiveSeriesラベルまで下にスクロールします。

    [グラフ化したメトリクス] ビューには、現在取り込まれているメトリクスのみが表示されます。

  2. [アクション] 列の [通知] アイコンを選択します。

  3. [メトリクスと条件の指定] で、[条件値] フィールドにしきい値の条件を入力し、[次へ] を選択します。

  4. [アクションの設定] で、通知の送信先となる既存の SNS トピックを選択するか、新しいトピックを作成します。

  5. [名前と説明を追加] に、アラームの名前と、必要に応じて説明を追加します。

  6. [アラームを作成] を選択します。