線上儲存 - Amazon SageMaker

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

線上儲存

線上儲存是一種低延遲、高可用性的資料儲存,可提供即時查詢功能。它通常用於機器學習 (ML) 模型服務。您可以在建立特徵群組時選擇標準線上儲存 (Standard) 或記憶體內層線上儲存 (InMemory)。透過這種方式,您可以在考慮效能和成本的同時,選取最符合特定應用程式的讀取和寫入模式的儲存類型。如需定價的詳細資訊,請參閱 Amazon SageMaker Pricing

線上儲存包含下列 StorageType 選項。如需線上商店內容的詳細資訊,請參閱 OnlineStoreConfig

標準層儲存類型

Standard 層是適用於線上儲存特徵群組的受管低延遲資料儲存。它為您的應用程式提供機器學習 (ML) 模型服務的快速資料擷取。Standard 是預設的儲存類型。

記憶體內層儲存類型

InMemory 層是適用於線上儲存特徵群組的受管資料儲存,支援非常低延遲的擷取。它為用於高輸送量應用程式的機器學習 (ML) 模型服務提供大規模即時資料擷取。InMemory 層由 Amazon ElastiCache (Redis) 提供動力OSS。如需詳細資訊,請參閱什麼是 Amazon ElastiCache (Redis)OSS?

線上儲存 InMemory 層支援集合類型,也就是清單、集合和向量。如需InMemory集合類型的詳細資訊,請參閱 集合類型

特徵商店為線上儲存提供低延遲的讀取和寫入功能。應用程式延遲主要由兩個主要元件組成:基礎設施或網路延遲和特徵存放區API延遲。減少網路延遲有助於獲得對特徵商店的最低延遲讀寫。您可以部署至 Feature Store Runtime 端點 AWS PrivateLink ,以減少對 Feature Store 的網路延遲。透過 AWS PrivateLink,您可以使用介面VPC端點,以可擴展的方式從 Amazon Virtual Private Cloud (VPC) 私下存取所有 Feature Store 執行期API操作。privateDNSEnabled 選項設定為 true 的 AWS PrivateLink 部署:

  • 它會將所有 Feature Store 讀取/寫入流量保留在您的 內VPC。

  • 它會在使用特徵商店時,將流量與產生流量的用戶端保持在相同的 AZ 中。這可避免AZs減少網路延遲之間的「跳轉」。

請依照使用介面VPC端點存取 AWS 服務中的步驟 AWS PrivateLink ,將 設定為 Feature Store。中 Feature Store Runtime 的服務名稱 AWS PrivateLink 為 com.amazonaws.region.sagemaker.featurestore-runtime

InMemory 分層線上商店會根據儲存用量和請求自動擴展。如果使用量快速變化,自動調整可能需要幾分鐘的時間來適應新的使用模式。在自動擴展期間:

  • 特徵群組的寫入操作可能會收到限流錯誤。您應該在幾分鐘後重試您的要求。

  • 特徵群組的讀取操作可能會收到限流錯誤。在這種情況下,適用標準重試策略。

  • 讀取操作可能會出現延遲提升。

預設 InMemory 層特徵群組大小上限為 50 GiB。

請注意,該 InMemory 層目前僅支援線上特徵群組,不支援線上 + 離線特徵群組,因此 InMemory 層的線上和離線儲存之間不會進行複寫。此外, InMemory層目前不支援客戶受管KMS金鑰。