Amazon Managed Service for Prometheus Service Quotas - Amazon Managed Service for Prometheus

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

Amazon Managed Service for Prometheus Service Quotas

以下兩節說明與 Amazon Managed Service for Prometheus 相關的配額和限制。

Service Quotas

Amazon Managed Service for Prometheus 具有以下配額。適用於 Prometheus 的 Amazon 受管服務會出售CloudWatch 使用量指標,以監控 Prometheus 資源使用情況。使用使 CloudWatch 用指標警報功能,您可以監控 Prometheus 資源和使用情況,以防止限制錯誤。

隨著專案和工作區的成長,您可能需要監控或請求增加的最常見配額為:每個工作區的啟用中序列每個工作區的擷取率,以及每個工作區的擷取成組分解大小

對於所有可調整的配額,您可透過選取可調整欄中的連結或請求增加配額,來請求提高配額。

動態套用每個工作區的啟用中序列限制。如需詳細資訊,請參閱 啟用中序列預設值。每個工作區的擷取率和每個工作區擷取成組分解大小共同控制您可以將資料擷取至工作區的速度。如需更多資訊,請參閱攝入節流

注意

除非另有說明,否則這些配額是每個工作區。

名稱 預設 可調整 描述
每個工作區含中繼資料的啟用中指標 每個受支援的區域:20,000 每個工作區具有中繼資料的唯一啟用中指標數量。
每個工作區的啟用中序列 每個受支援的區域:每 2 小時 10,000,000 每個工作區的唯一啟用中序列數量。如果在過去 2 小時內呈報範例,則該序列為啟用中。容量從 2M 到 10M 是根據最後 30 分鐘的使用量自動調整。
警示管理員定義檔案中的警示彙總群組大小 每個受支援的區域:1,000 警示管理員定義檔案中警示彙總群組的大小上限。group_by 的每個標籤值組合都會建立彙總群組。
警示管理員定義檔案大小 每個受支援的區域:1 MB 警示管理員定義檔案的大小上限。
警報管理器中的警報裝載大小 每個受支援的區域:20 MB 每個工作區之所有「警示管理員」警示的最大警示承載大小。警示大小取決於標籤和註釋。
警報管理器中的警報 每個受支援的區域:1,000 每個工作區同時警示管理員警示的最大數目。
HA 追蹤器叢集 每個受支援的區域:500 HA 追蹤器會追蹤每個工作區擷取樣本的叢集數量上限。
擷取每個工作區成組分解大小 每個受支援的區域:1,000,000 每個工作區每秒一次突發可擷取的最大範例數量。
每個工作區的擷取速率 每個受支援的區域:170,000 每個工作區每秒的指標範例擷取率。
警示管理員定義檔案中的抑制規則 每個受支援的區域:100 警示管理員定義檔案中抑制規則的數量上限。
標籤大小 每個受支援的區域:7 KB 系列接受所有標籤和標籤值的最大組合大小。
每個公制系列的標籤 每個受支援的區域:70 每個指標序列的標籤數量。
中繼資料長度 每個受支援的區域:1 KB 指標中繼資料可接受的最大長度。中繼資料為指標名稱、說明和單位。
每個指標的中繼資料 每個受支援的區域:10 每個指標的中繼資料數量。
警示管理員路由樹狀結構節點 每個受支援的區域:100 警示管理員路由樹狀結構中節點的數量上限。
每個區域的 API 作業數 (以每秒交易計) 每個受支援的區域:10 適用於 Prometheus API 的所有 Amazon 受管服務 (包括工作區 CRUD API、標記 API、規則群組命名空間 CRUD API 和警示管理員定義 CRUD API),每秒每秒的 API 作業數目上限。
每個工作 GetSeries區的數量 GetLabels 和 GetMetricMetadata API 作業 (以每秒交易計) 每個受支援的區域:10 每個工作區每秒可執行的最大數目 GetSeries,以 GetLabels 及與 GetMetricMetadata Prometheus 相容的 API 作業數目上限。
每個工作區的 QueryMetrics API 作業數 (以每秒交易計) 每個受支援的區域:300 每個工作區每秒可執行的 QueryMetrics Prometheus 相容 API 作業數目上限。
每個工作區的 RemoteWrite API 作業數 (以每秒交易計) 每個受支援的區域:3,000 個 每個工作區每秒可執行的 RemoteWrite Prometheus 相容 API 作業數目上限。
每個工作區的其他 Prometheus 相容 API 作業數 (以每秒交易計) 每個受支援的區域:100 所有其他與 Prometheus 相容的 API (包括等 ListAlerts),每個工作區每秒的最大 API 作業數目。 ListRules
查詢位元組以進行即時查詢 所有受支援的區域:5 GB 單一即時查詢可掃描的最大位元組數。
範圍查詢的查詢位元組 所有受支援的區域:5 GB 在單一範圍查詢中,每 24 小時間隔可掃描的最大位元組數。
擷取的查詢區塊 每個受支援的區域:20,000,000 單一查詢期間可掃描的區塊的最大數量。
範例查詢 每個受支援的區域:50,000,000 單一查詢期間可掃描的最大範例數量。
查詢序列擷取 每個受支援的區域:12,000,000 單一查詢期間可掃描的最大序列數量。
查詢時間範圍 (天) 每個受支援的區域:32 QueryMetrics、 GetSeries和 GetLabels API 的最大時間範圍。
請求規模 每個受支援的區域:1 MB 擷取或查詢的請求大小上限。
擷取資料的保留時間 (天) 每個受支援的區域:150 工作區內資料保留的天數。系統會刪除超過此值的資料。您可以請求配額更改以增加或減少此值。
規則評估間隔 每個受支援的區域:30 秒 每個工作區規則群組的最小規則評估間隔。
規則群組命名空間定義檔大小 每個受支援的區域:1 MB 規則群組命名空間定義檔案的大小上限。
每個工作區的規則 每個受支援的區域:2,000 每個工作區的規則數量上限。
警示管理員定義檔案中的範本 每個受支援的區域:100 警示管理員定義檔案中的範本數量上限。
每個帳戶每個區域的工作 每個受支援的區域:25 每個區域的工作區的數量上限。

啟用中序列預設值

Amazon Managed Service for Prometheus 可讓您預設使用最多啟用中時間序列的配額。

Amazon Managed Service for Prometheus 工作區會自動調整為您的擷取量。隨著使用量增加,Amazon Managed Service for Prometheus 會將您的時間序列容量自動增加至基準使用量的兩倍,直到預設配額為止。例如,如果過去 30 分鐘的平均啟用中時間序列為 350 萬,則您最多可以使用 700 萬個時間序列,而不需進行限流。

如果您需要先前基準的兩倍以上,Amazon Managed Service for Prometheus 會隨著擷取磁碟區增加而自動分配更多容量,以協助確保您的工作負載不會經歷持續的限流,直到到達您的配額為止。但是,如果過去 30 分鐘超過先前基準的兩倍以上,還是會出現限流情況。為避免限流,Amazon Managed Service for Prometheus 建議在增加到先前啟用中時間序列的兩倍以上時,逐漸增加擷取。

注意

啟用中時間序列的最小容量為 2 百萬,若您的序列小於 200 萬個,則不會出現限流。

若要超過預設配額,您可請求增加配額。

攝入節流

適用於 Prometheus 的 Amazon 受管服務會根據您目前的限制,針對每個工作區進行節流擷取。這有助於維護工作區的效能。如果超過限制,您將DiscardedSamples在 CloudWatch 指標中看到(rate_limited原因)。您可以使 CloudWatch 用 Amazon 監控擷取,並建立警示,以便在您接近節流限制時發出警告。如需詳細資訊,請參閱 使用 CloudWatch 指標監控 Prometheus 資源的 Amazon 受管服務

適用於 Prometheus 的 Amazon 受管服務使用權杖儲存貯體演算法來實作擷取節流。使用此算法,您的帳戶擁有一個存儲區,其中包含特定數量的令牌。存儲桶中的令牌數量代表您在任何給定秒鐘的獲取限制。

每個擷取的資料樣本都會從值區中移除一個 Token。如果您的儲存貯體大小 (每個工作區的擷取成組分解大小) 為 1,000,000,您的工作區可以在一秒內擷取一百萬個資料樣本。如果要擷取的樣本超過一百萬個,則會進行節流,並且不會擷取任何更多記錄。其他數據樣本將被丟棄。

儲存貯體會以設定的速率自動補充。如果存儲桶低於其最大容量,則每秒會向其添加一組數量的令牌,直到達到其最大容量為止。如果在補充令牌到達時存儲桶已滿,則將其丟棄。值區的容量不能超過其最大數量的代幣。取樣擷取的重新填充率是由每個工作區的擷取率限制所設定。如果每個工作區的擷取率設定為 170,000,則值區的重新填充率為每秒 170,000 個代幣。

如果您的工作區一秒內擷取 1,000,000 個資料樣本,您的儲存貯體會立即減少為零個權杖。然後,桶每秒會重新填充 170,000 個代幣,直到達到 1,000,000 個代幣的最大容量為止。如果沒有更多的擷取,先前的空值區將會在 6 秒內回復為其最大容量。

注意

擷取會在批次要求中進行。如果您有 100 個可用的令牌,並發送包含 101 個樣本的請求,則整個請求將被拒絕。適用於 Prometheus 的 Amazon 受管服務不接受部分請求。如果您正在編寫收集器,則可以管理重試次數 (使用較小的批次或經過一段時間後)。

您不需要等待值區已滿,您的工作區才能擷取更多資料樣本。您可以在添加到存儲桶中時使用令牌。如果您立即使用補充令牌,則存儲桶未達到其最大容量。例如,如果您耗盡儲存貯體,您可以繼續每秒內擷取 170,000 個資料樣本。只有當您每秒擷取少於 170,000 個資料樣本時,儲存貯體才能重新填充至最大容量。

對擷取資料的其他限制

針對擷取到工作區的資料,Amazon Managed Service for Prometheus 也有下列額外要求。這些不可調整。

  • 拒絕擷取超過 1 小時的指標範例。

  • 每個範例和中繼資料都必須有指標名稱。