Amazon Managed Service for Prometheus のサービスクォータ - Amazon Managed Service for Prometheus

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

Amazon Managed Service for Prometheus のサービスクォータ

以下の 2 つのセクションでは、Amazon Managed Service for Prometheus に関連付けられているクォータと制限について説明します。

Service Quotas

Amazon Managed Service for Prometheus には、以下に示すクォータがあります。Amazon Managed Service for Prometheus は、Prometheus のリソース使用状況をモニタリングするための CloudWatch 使用状況メトリクスを提供しています。Amazon CloudWatch 使用状況メトリクスアラーム機能を使用すると、Prometheus リソースと使用状況をモニタリングして、制限エラーを防ぐことができます。

プロジェクトとワークスペースが大きくなるにつれて、モニタリングまたは引き上げをリクエストする必要がある最も一般的なクォータは、ワークスペースあたりのアクティブシリーズとワークスペースあたりの取り込みレートです。

すべての調整可能なクォータについては、調整可能な列のリンクを選択するか、クォータの引き上げをリクエストすることで、クォータの引き上げをリクエストできます。

ワークスペースごとのアクティブシリーズ数の制限は動的に適用されます。詳細については、「アクティブシリーズのデフォルトクォータ」を参照してください。ワークスペースあたりの取り込みレートのクォータは、ワークスペースにデータを取り込む速度を決定します。詳細については、「取り込みスロットリング」を参照してください。

注記

特に明記されていない限り、これらのクォータはワークスペースごとに設定されます。ワークスペースあたりのアクティブなシリーズの最大値は 10 億です。

名前 デフォルト 引き上げ可能 説明
ワークスペースごとのメタデータを持つアクティブなメトリクス数 サポートされている各リージョン: 20,000 なし ワークスペースごとの、メタデータを持つ一意のアクティブなメトリクスの数。注: 制限に達すると、メトリクスサンプルは記録されますが、制限を超えたメタデータは削除されます。
ワークスペースごとのアクティブなシリーズ数 サポートされている各リージョン: 50,000,000 あり ワークスペースあたりの一意のアクティブシリーズの数 (最大 10 億)。過去 2 時間以内にサンプルが報告された場合、そのシリーズはアクティブです。2 M から 50 M までの容量は、過去 30 分間の使用に基づいて自動的に調整されます。
アラートマネージャー定義ファイル内のアラート集約グループのサイズ サポートされている各リージョン: 1,000 あり アラートマネージャー定義ファイル内のアラート集約グループの最大サイズ。group_by のラベル値の組み合わせごとに集約グループが作成されます。
アラートマネージャー定義ファイルのサイズ サポートされている各リージョン: 1,000,000 なし アラートマネージャー定義ファイルの最大サイズ、バイト単位。
アラートマネージャーのアラートペイロードサイズ サポートされている各リージョン: 20 なし ワークスペースあたりのすべてのアラートマネージャーアラートの最大アラートペイロードサイズ。メガバイト単位。アラートのサイズは、ラベルと注釈に依存します。
アラートマネージャーのアラート数 サポートされている各リージョン: 1,000 あり ワースペースごとの同時アラートマネージャーアラートの最大数。
HA トラッカーのクラスター数 サポートされている各リージョン: 500 なし ワークスペースごとの、取り込まれたサンプルについて HA トラッカーが追跡するクラスターの最大数。
ワークスペースごとの取り込みレート サポートされている各リージョン: 170,000 あり ワークスペースごとの、1 秒あたりのメトリクスサンプルの取り込みレート。
アラートマネージャー定義ファイル内の禁止ルール数 サポートされている各リージョン: 100 可能 アラートマネージャー定義ファイル内の禁止ルールの最大数。
ラベルサイズ サポートされている各リージョン: 7 なし 系列に受け入れられるすべてのラベルとラベル値の最大結合サイズをキロバイト単位で表します。
ワークスペースあたりの LabelSet の制限 サポートされている各リージョン: 100 可能 ワークスペースごとに作成できるラベルセット制限の最大数。
メトリクスシリーズごとのラベル数 サポートされている各リージョン: 150 あり メトリクスシリーズごとのラベルの数。
メタデータの長さ サポートされている各リージョン: 1 [いいえ] メトリクスメタデータに許容される最大長、キロバイト単位。メタデータとは、メトリクス名、タイプ、単位、ヘルプテキストを指します。
メトリクスごとのメタデータ数 サポートされている各リージョン: 10 なし メトリクスごとのメタデータの数。注: 制限に達すると、メトリクスサンプルは記録されますが、制限を超えたメタデータは削除されます。
アラートマネージャーのルーティングツリー内のノード数 サポートされている各リージョン: 100 可能 アラートマネージャーのルーティングツリー内の最大ノード数。
リージョンごとの API オペレーション数 (トランザクション数/秒) サポートされている各リージョン: 10 あり ワークスペース CRUD API、タグ付け API、ルールグループ名前空間 CRUD APIs、 APIs アラートマネージャー定義 CRUD APIs など、すべての Amazon Managed Service for Prometheus APIs のリージョンごとの 1 秒あたりの API オペレーションの最大数 APIs 。
ワークスペースごとの GetSeries 、GetLabels、GetMetricMetadata API オペレーション数 (トランザクション数/秒) サポートされている各リージョン: 10 なし ワークスペースごとの 1 秒あたりにおける GetSeries、GetLabels、GetMetricMetadata Prometheus 互換 API オペレーションの最大数。
ワークスペースごとの QueryMetrics API オペレーション数 (トランザクション数/秒) サポートされている各リージョン: 300 なし ワークスペースごとの 1 秒あたりにおける QueryMetrics Prometheus 互換 API オペレーションの最大数。
ワークスペースごとの RemoteWrite API オペレーション数 (トランザクション数/秒) サポートされている各リージョン: 3,000 なし ワークスペースごとの 1 秒あたりにおける RemoteWrite Prometheus 互換 API オペレーションの最大数。
ワークスペースごとの他の Prometheus 互換 API オペレーション数 (トランザクション数/秒) サポートされている各リージョン: 100 なし 他のすべての Prometheus 互換 API (ListAlerts、ListRules など) におけるワークスペースごとの 1 秒あたりの API オペレーションの最大数。
インスタントクエリのクエリバイト数 サポートされている各リージョン:5 なし 1 つのインスタントクエリでスキャンできる最大バイト数。ギガバイト単位。
範囲クエリのクエリバイト数 サポートされている各リージョン:5 なし 1 つの範囲クエリで 24 時間間隔ごとにスキャンできる最大バイト数。ギガバイト単位。
クエリサンプル数 サポートされている各リージョン: 50,000,000 なし 1 つのクエリでスキャンできるサンプルの最大数。
フェッチされるクエリシリーズ数 サポートされている各リージョン: 12,000,000 なし 1 つのクエリでスキャンできるシリーズの最大数。
クエリ時間範囲の日数 サポートされている各リージョン: 95 なし QueryMetrics、GetSeries、GetLabels API の最大時間範囲。
リクエストサイズ サポートされている各リージョン: 1 [いいえ] 取り込みまたはクエリの最大リクエストサイズ。メガバイト単位。
ルール評価間隔 サポートされている各リージョン: 30 あり ワークスペースあたりのルールグループの最小ルール評価間隔。秒単位。
ルールグループ名前空間定義ファイルのサイズ サポートされている各リージョン: 1,000,000 なし ルールグループ名前空間定義ファイルの最大サイズ、バイト単位。
ワークスペースごとのルール数 サポートされている各リージョン: 2,000 あり ワークスペースごとのルールの最大数。
ワークスペースあたりのサイレンス サポートされている各リージョン: 1,000 あり ワークスペースあたりの、期限切れ、アクティブ、保留中の無音を含む最大無音数。
アラートマネージャー定義ファイル内のテンプレート数 サポートされている各リージョン: 100 可能 アラートマネージャー定義ファイル内のテンプレートの最大数。
アカウントごとのリージョンあたりのワークスペース数 サポートされている各リージョン: 25 あり リージョンあたりのワークスペースの最大数。

アクティブシリーズのデフォルトクォータ

Amazon Managed Service for Prometheus ワークスペースは、取り込みの使用に自動的に適応します。使用量が増えると、サービスは時系列容量をデフォルトのクォータに自動的に増やします。

Amazon Managed Service for Prometheus ワークスペースは、使用状況に基づいて、次の 2 つの方法で自動的にスケーリングされます。

  1. 30 分の平均使用量が 500 万シリーズ未満の場合、容量は 2 倍になります (たとえば、350 万の使用量のワークスペースは 7M00 万の容量を取得します)。

  2. 使用量が 500 万シリーズを超えると、ワークスペースは 1,000 万のバッファを追加します (たとえば、使用量が 25M00 万のワークスペースは 35M0 万の容量を取得します)。

Amazon Managed Service for Prometheus は、クォータまで取り込みが増加すると、より多くの容量を自動的に割り当てます。これにより、ワークロードで持続的なスロットリングが発生しなくなります。ただし、過去 30 分間に計算された前のベースラインを 2 倍または 1,000 万を超えると、スロットリングが発生する可能性があります。スロットリングを避けるために、Amazon Managed Service for Prometheus では、以前のベースラインを超えて増加すると、徐々に取り込みを増やすことをお勧めします。

注記

アクティブな時系列の最小容量は 200 万で、系列が 200 万未満の場合、スロットリングはありません。

デフォルトのクォータを超えるには、クォータの引き上げをリクエストできます。

デフォルトのクォータを超えるスケーリング

デフォルトのアクティブシリーズクォータを超えるクォータの引き上げをリクエストすると、Amazon Managed Service for Prometheus はそれに応じてワークスペース容量を調整します。増加した容量を十分に活用しない場合、サービスは時間の経過とともに未使用の部分を再利用します。使用量が増えると、ワークスペースは自動的にスケールアップします。

ただし、過去 2 時間から計算された以前のベースラインに対してアクティブな時系列が 2 倍以上または 5,000 万を超える場合、スロットリングが発生する可能性があります。例:

  • クォータが 1 億でベースラインが 3,000 万の場合、スロットリングなしで 2 時間以内に 6,000 万までスケールアップできます。

  • クォータが 1 億でベースラインが 5,000 万の場合、スロットリングなしで 2 時間以内に 1 億までスケールアップできます。

取り込みスロットリング

Amazon Managed Service for Prometheus は、現在の制限に基づいて、各ワークスペースの取り込みをスロットリングします。これは、ワークスペースのパフォーマンスを維持するのに役立ちます。制限を超えると、CloudWatch メトリクスに DiscardedSamples が (rate_limited の理由と共に) 表示されます。CloudWatch を使用して取り込みをモニタリングし、スロットリング制限に近づいたときに警告するアラームを作成できます。詳細については、「CloudWatch メトリクスを使用して Amazon Managed Service for Prometheus のリソースモニタリングする」を参照してください。

Amazon Managed Service for Prometheus は、トークンバケットアルゴリズムを使用して取り込みのスロットリングを実装します。このアルゴリズムでは、アカウントには、特定の数のトークンを保持するバケットがあります。バケット内のトークンの数は、特定の秒における取り込み制限を表します。

取り込まれたデータサンプルごとに、バケットから 1 つのトークンが削除されます。バケットサイズ (ワークスペースあたりの取り込みレート) 1,000,000 の場合、ワークスペースは 1 秒で 100 万個のデータサンプルを取り込むことができます。取り込むサンプルが 100 万個を超えると、スロットリングされ、それ以上のレコードは取り込まれません。余分なデータサンプルは破棄されます。

バケットは、設定したレートで自動的に補充されます。バケットが最大容量に達していない場合、最大容量に達するまで、設定した数のトークンが毎秒追加されます。補充トークンが到着したときにバケットが満杯である場合、補充トークンは破棄されます。バケットは最大数を超えてトークンを保持することはできません。サンプル取り込みの補充レートは、ワークスペースごとの取り込みレートの制限に従って設定します。ワークスペースごとの取り込みレートを 170,000 に設定すると、バケットの補充レートは 1 秒あたり 17 万トークンになります。

ワークスペースが 1 秒間に 100 万個のデータサンプルを取り込むと、バケット内のトークン数はすぐにゼロまで減ります。その後、バケットは最大容量の 100 万トークンに達するまで、毎秒 17 万トークンずつ補充されます。最大数を超えない限り、ゼロになったバケットは 6 秒で最大容量に戻ります。

注記

取り込みはバッチリクエストで行われます。使用可能なトークンが 100 個あり、101 個のサンプルのリクエストを送信すると、リクエスト全体が拒否されます。Amazon Managed Service for Prometheus はリクエストを部分的に受け入れることはしません。コレクターを作成すると、再試行を管理できます (バッチを小さくするか、しばらく経ってから再試行します)。

バケットが満杯になるまで待たなくても、ワークスペースは追加のデータサンプルを取り込むことができます。トークンはバケットに追加されるとすぐに使用できます。補充トークンをすぐに使用すると、バケットが最大容量に達することはありません。例えば、バケットを使い果たしても、1 秒あたり 17 万個のデータサンプルを引き続き取り込むことができます。1 秒あたり 17 万未満のデータサンプルを取り込む場合のみ、バケットを最大容量まで補充できます。

取り込まれるデータに関する追加の制限

Amazon Managed Service for Prometheus には、ワークスペースに取り込まれるデータに関して次の要件があります。これらは調整できません。

  • 1 時間以上経過したメトリクスサンプルは取り込まれません。

  • すべてのサンプルとメタデータにメトリクス名が必要です。