Amazon 的數據隱私 SageMaker - Amazon SageMaker

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

Amazon 的數據隱私 SageMaker

Amazon SageMaker 收集有關在訓練期間使用的 AWS自有和開放原始碼程式庫的彙總資訊。 SageMaker 使用此彙總中繼資料來改善服務和客戶體驗。

以下各節說明 SageMaker 收集的中繼資料類型,以及如何選擇退出中繼資料收集。

收集的資訊類型

用量資訊

來自與 SageMaker 訓練 AWS搭配使用的開放原始碼程式庫的中繼資料,例如用於分散式訓練、編譯和量化的元數據。

錯誤

來自非預期行為的錯誤,包括與 SageMaker 訓練平台互動所導致的失敗、當機、串聯和失敗。

如何選擇退出中繼資料收集

使用 CreateTrainingJob API 建立訓練工作時,您可以選擇不與 SageMaker 訓練共用彙總的中繼資料。如果您使用主控台建立訓練工作,依預設會停用中繼資料收集。

重要

您必須針對您提交的每個訓練工作選擇退出中繼資料收集。您也必須選擇退出 API 呼叫,如下列範例所示。您無法選擇在訓練指令碼中選擇退出。

下一節說明如何使用 AWS CLI、 AWS SDK for Python (Boto3)或 SageMaker Python SDK 選擇退出中繼資料集合。

使用 AWS Command Line Interface (AWS CLI) 選擇退出中繼資料收集

若要使用選擇退出中繼資料收集 AWS CLI,請在 create-training-job API 1OPT_OUT_TRACKING將環境變數設定為,如下列程式碼範例所示。

aws sagemaker create-training-job \ --training-job-name your_job_name \ --algorithm-specification AlgorithmName=your_algorithm_name\ --output-data-config S3OutputPath=s3://bucket-name/key-name-prefix \ --resource-config InstanceType=ml.c5.xlarge, InstanceCount=1 \ --stopping-condition MaxRuntimeInSeconds=100 \ --environment OPT_OUT_TRACKING=1

選擇退出中繼資料收集 AWS SDK for Python (Boto3)

若要使用 SDK for Python (Boto3) 選擇退出中繼資料收集,請在 create_training_job API 1OPT_OUT_TRACKING將環境變數設定為,如下列程式碼範例所示。

boto3.client('sagemaker').create_training_job( TrainingJobName='your_training_job', AlgorithmSpecification={ 'AlgorithmName': 'your_algorithm_name', 'TrainingInputMode': 'File', }, RoleArn='your_arn', OutputDataConfig={ 'S3OutputPath': 's3://bucket-name/key-name-prefix', }, ResourceConfig={ 'InstanceType': 'ml.m4.xlarge', 'InstanceCount': 1, 'VolumeSizeInGB': 123, }, StoppingCondition={ 'MaxRuntimeInSeconds': 123, }, Environment={ 'OPT_OUT_TRACKING': '1' }, )

使用 SageMaker Python SDK 選擇退出中繼資料收集

若要使用 SageMaker Python SDK 選擇退出中繼資料收集,請OPT_OUT_TRACKING將環境變數設定為 SageMaker 估算器1內部,如下列程式碼範例所示。

sagemaker.estimator( image_uri='path_to_container', role='rolearn', instance_count=1, instance_type='ml.c5.xlarge', environment={ 'OPT_OUT_TRACKING': '1' }, )

選擇退出整個中繼資料收集帳戶

如果您想要選擇退出多個帳戶的中繼資料收集,您可以設定環境變數以選擇退出追蹤整個帳戶。您必須使用 SageMaker Python SDK 來選擇退出帳戶層級的中繼資料收集。

下列程式碼範例顯示如何選擇退出追蹤帳戶範圍。

SchemaVersion: '1.0' SageMaker: TrainingJob: Environment: 'OPT_OUT_TRACKING': '1'

如需有關如何選擇退出追蹤整個帳戶的詳細資訊,請參閱搭配 SageMaker Python SDK 配置和使用預設值。

其他資訊

如果您的下游服務依賴於 SageMaker培訓

如果您操作的服務依賴於 SageMaker 訓練,強烈建議您將 SageMaker 訓練平台中的彙總中繼資料收集通知客戶,並向他們提供選擇退出的選擇。或者,您也可以代表客戶選擇退出中繼資料收集。

如果您是使用 SageMaker培訓的服務的客戶或客戶

如果您是使用 SageMaker 訓練的服務的客戶或客戶,請使用上一節中偏好的方法來選擇退出中繼資料收集。