輸送量模式 - Amazon SageMaker

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

輸送量模式

Amazon SageMaker 功能商店提供兩種定價模式供您選擇:隨需 (On-demand) 和佈建 (Provisioned) 輸送量模式。 On-demand最適合用於較不可預測的流量,同時最Provisioned適合用於一致且可預測的流量。

您可以選擇在指定功能群組的Provisioned輸送量模式On-demand和輸送量模式之間切換,以適應應用程式流量模式變更或較不可預測的期間。在 24 小時內,您只能將圖徵群組輸送量模式更新為On-demand一次。輸送量模式可以透過程式設計方式使用UpdateFeature群組 API 或透過主控台 UI 更新。如需使用主控台的詳細資訊,請參閱在控制台中使用 Amazon SageMaker 功能商店

您可以將Provisioned輸送量模式與僅離線功能群組或具有Standard儲存區類型的功能群組搭配使用。對於其他儲存組態,會使用On-demand輸送量模式。如需有關線上和離線儲存設定的資訊,請參閱線上儲存離線儲存分別。

如需有關定價的詳細資訊,請參閱 Amazon SageMaker 定價

按需輸送量模式

當您使用工作負載不明、無法預測應用程式流量且無法預測容量需求的功能群組時,On-demand(預設) 輸送量模式最有效。

On-demand模式會向您收取應用程式在功能群組上執行的讀取和寫入費用。您無需指定預期應用程式執行多少讀取和寫入輸送量,因為 Feature Store 可在工作負載上升或下降時立即容納工作負載。您只需為您使用的項目付費,以ReadRequestsUnits和計量單位WriteRequestsUnits

您可以使用CreateFeature群組或UpdateFeature群組 API 或透過主控台 UI 啟用On-demand輸送量模式。如需使用主控台 UI 的詳細資訊,請參閱在控制台中使用 Amazon SageMaker 功能商店

重要

在 24 小時內,您只能將圖徵群組輸送量模式更新為On-demand一次。

佈建輸送量模式

當您使用具有可預測工作負載的功能群組時,Provisioned輸送量模式效果最佳,而且您可以預測容量需求以控制成本。如此可讓您提前預測輸送量需求的特定工作負載,更具成本效益。

將功能群組設定為Provisioned模式時,您可以指定容量單位,這些單位是應用程式可從功能群組使用的最大容量。如果您的應用程式超過此Provisioned輸送量容量,則會受到要求節流的限制。

以下包含有關讀取和寫入容量單位的資訊。

  • 使用 GetRecord API 擷取最多 4 KB 的單一記錄將消耗至少 1 個 RCU (讀取容量單位)。擷取較大的裝載可能需要更多時間。所需的讀取容量單位總數取決於項目大小,包括功能商店服務新增的每筆記錄中繼資料。

  • 使用 PutRecord API 的有效負載為 1 KB 的單一寫入要求將消耗至少 1 個 WCU (寫入容量單位),分數承載會四捨五入至最接近的 KB。視事件時間、記錄的刪除狀態和存留時間 (TTL) 狀態而定,可能會耗用更多資料。如需 TTL 的詳細資訊,請參閱存留時間 (TTL) 記錄持續時間

重要

設定容量單位時,請考慮下列事項:

  • 即使您未完全使用該容量,仍需支付為功能群組佈建的讀取和寫入Provisioned容量的費用。

  • 如果您將讀取或寫入容量設定得太低,您的請求可能會遇到節流。

  • 在某些情況下,記錄可能會消耗額外的容量單位,這是由於功能商店服務為啟用各種功能而新增的記錄層級中繼資料。

  • 只使用GetRecordBatchGetRecord API 擷取功能的子集仍會使用與整個記錄相對應的 RCU。

  • 對於寫入容量,您應佈建 2 倍最近的尖峰容量,以避免在執行可能導致大量歷史記錄寫入的回填或大量擷取時進行限制。這是因為寫入歷史記錄會消耗額外的寫入容量。

  • 功能商店目前不支援Provisioned模式的 auto 縮放。

您可以使用CreateFeature群組或UpdateFeature群組 API 或透過主控台 UI 啟用On-demand輸送量模式。如需使用主控台 UI 的詳細資訊,請參閱在控制台中使用 Amazon SageMaker 功能商店

以下說明啟用Provisioned模式時,如何增加或減少功能群組的 RCU 和 WCU 輸送量。

增加佈建輸送量

您可以視需要使用UpdateFeature群組 API 或主控台 UI 增加 RCU 或 WCU。

降低佈建輸送量

您可以使UpdateFeature用群組 API 或主控台 UI 減少功能群組的 RCU 和 WCU (或兩者)。

對於您每天可以在功能群組上執行的Provisioned容量減少次數,有預設配額。一天是根據國際標準時間 (UTC) 來定義。在給定的一天,只要您在當天還沒有執行任何其他減少,您可以在一小時內執行最多四次減少。隨後,只要前一小時沒有減少,您就可以每小時執行一次額外的減少。一天的調降次數最多可達 27 次 (第一個小時的 4 次調降,加上一天中後續每 1 小時 1 次的調降)。

輸送量模式測量

On-demand模式中的功能群組將會發出ConsumedReadRequestsUnitsConsumedWriteRequestsUnits量度。Provisioned模式中的功能群組將會發出ConsumedReadCapacityUnitsConsumedWriteCapacityUnits量度。如需「功能存放區」度量的更多資訊,請參閱Amazon SageMaker 功能商店指標

輸送量模式限制

每個配額都 AWS 帳戶 有預設服務配額或限制,以協助確保可用性並管理帳單風險。如需有關預設配額和限制的資訊,請參閱配額、命名規則與資料類型

在某些情況下,這些限制可能會低於文件中所述的限制。如果您需要更高的上限,您可以提交提高申請。在達到當前限制之前這樣做是一個好主意,以避免工作中斷。如需服務配額以及如何請求提高配額的詳細資訊,請參閱 AWS 服務配額