Amazon のデータプライバシー SageMaker - Amazon SageMaker

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

Amazon のデータプライバシー SageMaker

Amazon SageMaker は、トレーニング中に使用される AWS所有のオープンソースライブラリの使用に関する集計情報を収集します。 は、この集計メタデータ SageMaker を使用してサービスとカスタマーエクスペリエンスを向上させます。

以下のセクションでは、 が SageMaker 収集するメタデータのタイプと、メタデータ収集をオプトアウトする方法について説明します。

収集される情報のタイプ

使用状況の情報

分散 SageMaker トレーニング、コンパイル、量子化など、トレーニングで使用される AWS所有ライブラリとオープンソースライブラリからのメタデータ。

エラー

SageMaker トレーニングプラットフォームとのやり取りによる障害、クラッシュ、カスケード、障害など、予期しない動作によるエラー。

メタデータ収集をオプトアウトする方法

CreateTrainingJob API を使用して SageMaker トレーニングジョブを作成するときに、集約されたメタデータをトレーニングと共有することをオプトアウトできます。コンソールを使用してトレーニングジョブを作成する場合、メタデータ収集はデフォルトで無効になっています。

重要

送信するトレーニングジョブごとにメタデータ収集をオプトアウトすることを選択する必要があります。次の例に示すように、API コールをオプトアウトすることもできます。トレーニングスクリプト内でオプトアウトすることを選択することはできません。

次のセクションでは、、 AWS CLI AWS SDK for Python (Boto3)、または SageMaker Python SDK を使用してメタデータ収集をオプトアウトする方法を示します。

AWS Command Line Interface (AWS CLI) を使用してメタデータコレクションをオプトアウトする

を使用してメタデータ収集をオプトアウトするには AWS CLI、次のコード例に示すように、 create-training-job API OPT_OUT_TRACKING1で 環境変数を に設定します。

aws sagemaker create-training-job \ --training-job-name your_job_name \ --algorithm-specification AlgorithmName=your_algorithm_name\ --output-data-config S3OutputPath=s3://bucket-name/key-name-prefix \ --resource-config InstanceType=ml.c5.xlarge, InstanceCount=1 \ --stopping-condition MaxRuntimeInSeconds=100 \ --environment OPT_OUT_TRACKING=1

を使用したメタデータ収集のオプトアウト AWS SDK for Python (Boto3)

SDK for Python (Boto3) を使用してメタデータ収集をオプトアウトOPT_OUT_TRACKINGするには、次のコード例に示すように、 create_training_job API 1で 環境変数を に設定します。

boto3.client('sagemaker').create_training_job( TrainingJobName='your_training_job', AlgorithmSpecification={ 'AlgorithmName': 'your_algorithm_name', 'TrainingInputMode': 'File', }, RoleArn='your_arn', OutputDataConfig={ 'S3OutputPath': 's3://bucket-name/key-name-prefix', }, ResourceConfig={ 'InstanceType': 'ml.m4.xlarge', 'InstanceCount': 1, 'VolumeSizeInGB': 123, }, StoppingCondition={ 'MaxRuntimeInSeconds': 123, }, Environment={ 'OPT_OUT_TRACKING': '1' }, )

SageMaker Python SDK を使用したメタデータ収集のオプトアウト

SageMaker Python SDK を使用してメタデータ収集をオプトアウトOPT_OUT_TRACKINGするには、次のコード例に示すように、 SageMaker 推定器1内で 環境変数を に設定します。

sagemaker.estimator( image_uri='path_to_container', role='rolearn', instance_count=1, instance_type='ml.c5.xlarge', environment={ 'OPT_OUT_TRACKING': '1' }, )

アカウント全体でメタデータ収集をオプトアウトする

複数のアカウントのメタデータ収集をオプトアウトする場合は、アカウント全体の追跡をオプトアウトするように環境変数を設定できます。アカウントレベルでメタデータ収集を SageMakerオプトアウトするには、Python SDK を使用する必要があります。

次のコード例は、アカウント全体の追跡をオプトアウトする方法を示しています。

SchemaVersion: '1.0' SageMaker: TrainingJob: Environment: 'OPT_OUT_TRACKING': '1'

アカウント全体の追跡をオプトアウトする方法の詳細については、 SageMaker 「Python SDK でのデフォルトの設定と使用」を参照してください。

追加情報

ダウンストリームサービスがトレーニングに依存し SageMakerている場合

SageMaker トレーニングに依存するサービスを運用する場合は、 SageMaker トレーニングプラットフォームの集計メタデータ収集についてお客様に通知し、オプトアウトの選択を提示することを強くお勧めします。または、顧客に代わってメタデータ収集をオプトアウトすることもできます。

トレーニングを使用する SageMakerサービスのクライアントまたは顧客の場合

SageMaker トレーニングを使用するサービスのクライアントまたは顧客の場合は、前のセクションで選択した方法を使用してメタデータ収集をオプトアウトします。