資料保護 - SageMaker Studio 管理最佳實務

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

資料保護

在建構 ML 工作負載之前,應該已備妥會影響安全性的基礎實務。例如,資料分類提供一種方法,根據敏感程度對資料進行分類,而加密會透過讓資料無法辨識存取來保護資料。這些方法很重要,因為它們支援防止處理不當或遵守法規義務等目標。

SageMaker AI Studio 提供多種功能來保護靜態和傳輸中的資料。不過,如AWS 共享責任模型所述,客戶有責任控制 AWS 在全球基礎設施上託管的內容。在本節中,我們會說明客戶如何使用這些功能來保護其資料。

保護靜態資料

為了保護您的 SageMaker AI Studio 筆記本以及模型建置資料和模型成品, SageMaker AI 會加密筆記本,以及來自訓練和批次轉換任務的輸出。 SageMaker AI 預設會使用 AWS Amazon S3 的 Managed Key 來加密這些筆記本。Amazon S3 的此 AWS 受管金鑰無法共用以進行跨帳戶存取。針對跨帳戶存取,請在建立 SageMaker AI 資源時指定客戶受管金鑰,以便共用以跨帳戶存取。

使用 SageMaker AI Studio,資料可以存放在下列位置:

  • S3 儲存貯體 – 啟用可共用筆記本時, SageMaker AI Studio 會在 S3 儲存貯體中共用筆記本快照和中繼資料。

  • EFS 磁碟區 – SageMaker AI Studio 會將磁碟EFS區連接至您的網域,以存放筆記本和資料檔案。即使刪除網域,此EFS磁碟區仍會持續存在。

  • EBS 磁碟區 – EBS 連接至筆記本執行所在的執行個體。此磁碟區會在執行個體期間持續存在。

使用 加密靜態 AWS KMS

  • 您可以傳遞AWS KMS 金鑰來加密連接至筆記本、訓練、調校、批次轉換任務和端點的EBS磁碟區。

  • 如果您未指定KMS金鑰, SageMaker AI 會使用系統管理的KMS金鑰來加密作業系統 (OS) 磁碟區和 ML 資料磁碟區。

  • 基於合規原因而需要使用KMS金鑰加密的敏感資料,應該存放在 ML 儲存磁碟區或 Amazon S3 中,這兩者都可以使用您指定的KMS金鑰進行加密。

保護傳輸中的資料

SageMaker AI Studio 可確保 ML 模型成品和其他系統成品在傳輸中和靜態時加密。對 SageMaker AI API和主控台的請求是透過安全的 (SSL) 連線提出。有些內部網路傳輸中資料 (服務平台內部) 未加密。其中包含:

  • 服務控制平面與訓練任務執行個體 (不是客戶資料) 之間的命令與控制通訊。

  • 分散式處理和訓練任務中節點之間的通訊 (網路內)。

不過,您可以選擇加密訓練叢集中節點之間的通訊。啟用包含所有容器的流量加密可能會增加訓練時間,特別是使用分散式深入學習演算法時。 

根據預設,Amazon SageMaker AI 會在 Amazon 中執行訓練任務VPC,以協助確保資料的安全。您可以新增另一個層級的安全性,透過設定私有來保護訓練容器和資料VPC。此外,您可以將 SageMaker AI Studio 網域設定為VPC僅以 模式執行,並設定VPC端點以透過私有網路路由流量,而不會透過網際網路輸出流量。

資料保護護欄

加密靜態 SageMaker AI 託管磁碟區

使用下列政策在託管 SageMaker AI 端點以進行線上推論時強制執行加密:

{ "Version": "2012-10-17", "Statement": [ { "Sid": "Encryption", "Effect": "Allow", "Action": [ "sagemaker:CreateEndpointConfig" ], "Resource": "*", "Condition": { "Null": { "sagemaker:VolumeKmsKey": "false" } } } ] }

加密模型監控期間使用的 S3 儲存貯體

Model Monitoring 會擷取傳送至 SageMaker AI 端點的資料,並將其存放在 S3 儲存貯體中。當您設定資料擷取組態時,您需要加密 S3 儲存貯體。目前沒有對此的補償性控制。

除了擷取端點輸出之外,模型監控服務還會檢查是否有偏離預先指定的基準。您需要加密輸出和用於監控偏離的中繼儲存磁碟區。

{ "Version": "2012-10-17", "Statement": [ { "Sid": "Encryption", "Effect": "Allow", "Action": [ "sagemaker:CreateMonitoringSchedule", "sagemaker:UpdateMonitoringSchedule" ], "Resource": "*", "Condition": { "Null": { "sagemaker:VolumeKmsKey": "false", "sagemaker:OutputKmsKey": "false" } } } ] }

加密 SageMaker AI Studio 網域儲存磁碟區

強制加密連接到 Studio 網域的儲存磁碟區。此政策需要使用者提供 CMK 來加密連接到 Studio 網域的儲存磁碟區。

{ "Version": "2012-10-17", "Statement": [ { "Sid": "EncryptDomainStorage", "Effect": "Allow", "Action": [ "sagemaker:CreateDomain" ], "Resource": "*", "Condition": { "Null": { "sagemaker:VolumeKmsKey": "false" } } } ] }

加密存放在 S3 中用來共用筆記本的資料

這是用來加密儲存貯體中儲存的任何資料的政策,用於在 SageMaker AI Studio 網域中的使用者之間共用筆記本:

{ "Version": "2012-10-17", "Statement": [ { "Sid": "EncryptDomainSharingS3Bucket", "Effect": "Allow", "Action": [ "sagemaker:CreateDomain", "sagemaker:UpdateDomain" ], "Resource": "*", "Condition": { "Null": { "sagemaker:DomainSharingOutputKmsKey": "false" } } } ] }

限制

  • 建立網域後,您就無法使用自訂 AWS KMS 金鑰更新連接的EFS磁碟區儲存體。

  • 建立金鑰後,您就無法使用KMS金鑰更新訓練/處理任務或端點組態。