Amazon의 데이터 프라이버시 SageMaker - Amazon SageMaker

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

Amazon의 데이터 프라이버시 SageMaker

Amazon은 훈련 중에 사용되는 AWS소유 및 오픈 소스 라이브러리 사용에 대한 집계 정보를 SageMaker 수집합니다. 는 이 집계 메타데이터를 SageMaker 사용하여 서비스 및 고객 경험을 개선합니다.

다음 섹션에서는 가 SageMaker 수집하는 메타데이터의 유형과 메타데이터 수집을 옵트아웃하는 방법에 대한 설명을 제공합니다.

수집되는 정보의 유형

사용 정보

분산 SageMaker 훈련, 컴파일 및 퀀타이즈에 사용되는 것과 같이 훈련에 사용되는 AWS소유 및 오픈 소스 라이브러리의 메타데이터입니다.

Errors

SageMaker 훈련 플랫폼과의 상호 작용으로 인한 실패, 충돌, 캐스케이드 및 실패를 포함한 예상치 못한 동작으로 인한 오류입니다.

메타데이터 수집을 옵트아웃하는 방법

를 사용하여 SageMaker 훈련 작업을 생성할 때 집계된 메타데이터를 훈련과 공유하지 않도록 선택할 수 있습니다CreateTrainingJobAPI. 콘솔을 사용하여 훈련 작업을 생성하는 경우 메타데이터 수집은 기본적으로 비활성화됩니다.

중요

제출하는 각 훈련 작업에 대한 메타데이터 수집을 옵트아웃하도록 선택해야 합니다. 또한 다음 예제와 같이 API 통화에서 옵트아웃하도록 선택해야 합니다. 훈련 스크립트 내에서는 옵트아웃을 선택할 수 없습니다.

다음 섹션에서는 AWS CLI AWS SDK for Python (Boto3), 또는 SageMaker Python 을 사용하여 메타데이터 수집을 옵트아웃하는 방법을 보여줍니다SDK.

AWS Command Line Interface (AWS CLI)를 사용하여 메타데이터 수집 옵트아웃

를 사용하여 메타데이터 수집을 옵트아웃하려면 다음 코드 예제와 create-training-job API 같이 OPT_OUT_TRACKING1에서 환경 변수를 로 AWS CLI설정합니다.

aws sagemaker create-training-job \ --training-job-name your_job_name \ --algorithm-specification AlgorithmName=your_algorithm_name\ --output-data-config S3OutputPath=s3://bucket-name/key-name-prefix \ --resource-config InstanceType=ml.c5.xlarge, InstanceCount=1 \ --stopping-condition MaxRuntimeInSeconds=100 \ --environment OPT_OUT_TRACKING=1

를 사용하여 메타데이터 수집 옵트아웃 AWS SDK for Python (Boto3)

for Python(Boto3)SDK을 사용하여 메타데이터 수집을 옵트아웃하려면 다음 코드 예제와 create_training_job API 같이 1에서 환경 변수를 OPT_OUT_TRACKING로 설정합니다.

boto3.client('sagemaker').create_training_job( TrainingJobName='your_training_job', AlgorithmSpecification={ 'AlgorithmName': 'your_algorithm_name', 'TrainingInputMode': 'File', }, RoleArn='your_arn', OutputDataConfig={ 'S3OutputPath': 's3://bucket-name/key-name-prefix', }, ResourceConfig={ 'InstanceType': 'ml.m4.xlarge', 'InstanceCount': 1, 'VolumeSizeInGB': 123, }, StoppingCondition={ 'MaxRuntimeInSeconds': 123, }, Environment={ 'OPT_OUT_TRACKING': '1' }, )

SageMaker Python을 사용하여 메타데이터 수집 옵트아웃 SDK

SageMaker Python을 사용하여 메타데이터 수집을 옵트아웃하려면 다음 코드 예제와 같이 환경 변수를 SageMaker 추정기 OPT_OUT_TRACKING 1 내부로 SDK설정합니다.

sagemaker.estimator( image_uri='path_to_container', role='rolearn', instance_count=1, instance_type='ml.c5.xlarge', environment={ 'OPT_OUT_TRACKING': '1' }, )

계정 전체에서 메타데이터 수집 옵트아웃

여러 계정에 대한 메타데이터 수집을 옵트아웃하려면 계정 전체 추적을 옵트아웃하도록 환경 변수를 설정할 수 있습니다. 계정 수준에서 메타데이터 수집을 SageMaker 옵트아웃SDK하려면 Python을 사용해야 합니다.

다음 코드 예제는 계정 전체 추적을 옵트아웃하는 방법을 보여줍니다.

SchemaVersion: '1.0' SageMaker: TrainingJob: Environment: 'OPT_OUT_TRACKING': '1'

계정 전체 추적을 옵트아웃하는 방법에 대한 자세한 내용은 SageMaker Python 에서 기본값 구성 및 사용을 참조하세요SDK.

추가 정보

다운스트림 서비스가 훈련에 SageMaker 의존하는 경우

SageMaker 훈련에 의존하는 서비스를 운영하는 경우 훈련 SageMaker 플랫폼의 집계 메타데이터 수집에 대해 고객에게 알리고 옵트아웃을 선택할 수 있는 옵션을 제공하는 것이 좋습니다. 또는 고객을 대신하여 메타데이터 수집을 옵트아웃할 수 있습니다.

교육을 사용하는 SageMaker 서비스의 클라이언트 또는 고객인 경우

SageMaker 훈련을 사용하는 서비스의 클라이언트 또는 고객인 경우 이전 섹션에서 선호하는 방법을 사용하여 메타데이터 수집을 옵트아웃합니다.