기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.
Amazon의 데이터 프라이버시 SageMaker
Amazon은 훈련 중에 사용되는 AWS소유 및 오픈 소스 라이브러리 사용에 대한 집계 정보를 SageMaker 수집합니다. 는 이 집계 메타데이터를 SageMaker 사용하여 서비스 및 고객 경험을 개선합니다.
다음 섹션에서는 가 SageMaker 수집하는 메타데이터의 유형과 메타데이터 수집을 옵트아웃하는 방법에 대한 설명을 제공합니다.
수집되는 정보의 유형
- 사용 정보
-
분산 SageMaker 훈련, 컴파일 및 퀀타이즈에 사용되는 것과 같이 훈련에 사용되는 AWS소유 및 오픈 소스 라이브러리의 메타데이터입니다.
- Errors
-
SageMaker 훈련 플랫폼과의 상호 작용으로 인한 실패, 충돌, 캐스케이드 및 실패를 포함한 예상치 못한 동작으로 인한 오류입니다.
메타데이터 수집을 옵트아웃하는 방법
를 사용하여 SageMaker 훈련 작업을 생성할 때 집계된 메타데이터를 훈련과 공유하지 않도록 선택할 수 있습니다CreateTrainingJob
API. 콘솔을 사용하여 훈련 작업을 생성하는 경우 메타데이터 수집은 기본적으로 비활성화됩니다.
중요
제출하는 각 훈련 작업에 대한 메타데이터 수집을 옵트아웃하도록 선택해야 합니다. 또한 다음 예제와 같이 API 통화에서 옵트아웃하도록 선택해야 합니다. 훈련 스크립트 내에서는 옵트아웃을 선택할 수 없습니다.
다음 섹션에서는 AWS CLI AWS SDK for Python (Boto3), 또는 SageMaker Python 을 사용하여 메타데이터 수집을 옵트아웃하는 방법을 보여줍니다SDK.
AWS Command Line Interface (AWS CLI)를 사용하여 메타데이터 수집 옵트아웃
를 사용하여 메타데이터 수집을 옵트아웃하려면 다음 코드 예제와 create-training-job
API 같이 OPT_OUT_TRACKING
1
에서 환경 변수를 로 AWS CLI설정합니다.
aws sagemaker create-training-job \ --training-job-name
your_job_name
\ --algorithm-specification AlgorithmName=your_algorithm_name
\ --output-data-config S3OutputPath=s3://bucket-name/key-name-prefix
\ --resource-config InstanceType=ml.c5.xlarge
, InstanceCount=1
\ --stopping-condition MaxRuntimeInSeconds=100
\ --environment OPT_OUT_TRACKING=1
를 사용하여 메타데이터 수집 옵트아웃 AWS SDK for Python (Boto3)
for Python(Boto3)SDK을 사용하여 메타데이터 수집을 옵트아웃하려면 다음 코드 예제와 create_training_job
API 같이 1
에서 환경 변수를 OPT_OUT_TRACKING
로 설정합니다.
boto3.client('sagemaker').create_training_job( TrainingJobName='
your_training_job
', AlgorithmSpecification={ 'AlgorithmName': 'your_algorithm_name
', 'TrainingInputMode': 'File', }, RoleArn='your_arn
', OutputDataConfig={ 'S3OutputPath': 's3://bucket-name/key-name-prefix
', }, ResourceConfig={ 'InstanceType': 'ml.m4.xlarge
', 'InstanceCount':1
, 'VolumeSizeInGB':123
, }, StoppingCondition={ 'MaxRuntimeInSeconds':123
, }, Environment={ 'OPT_OUT_TRACKING': '1' }, )
SageMaker Python을 사용하여 메타데이터 수집 옵트아웃 SDK
SageMaker Python을 사용하여 메타데이터 수집을 옵트아웃하려면 다음 코드 예제와 같이 환경 변수를 SageMaker 추정기 OPT_OUT_TRACKING
1
내부로 SDK설정합니다.
sagemaker.estimator( image_uri='
path_to_container
', role='rolearn
', instance_count=1
, instance_type='ml.c5.xlarge
', environment={ 'OPT_OUT_TRACKING': '1' }, )
계정 전체에서 메타데이터 수집 옵트아웃
여러 계정에 대한 메타데이터 수집을 옵트아웃하려면 계정 전체 추적을 옵트아웃하도록 환경 변수를 설정할 수 있습니다. 계정 수준에서 메타데이터 수집을 SageMaker 옵트아웃SDK하려면 Python을 사용해야 합니다.
다음 코드 예제는 계정 전체 추적을 옵트아웃하는 방법을 보여줍니다.
SchemaVersion: '1.0' SageMaker: TrainingJob: Environment: 'OPT_OUT_TRACKING': '1'
계정 전체 추적을 옵트아웃하는 방법에 대한 자세한 내용은 SageMaker Python 에서 기본값 구성 및 사용을 참조하세요SDK
추가 정보
다운스트림 서비스가 훈련에 SageMaker 의존하는 경우
SageMaker 훈련에 의존하는 서비스를 운영하는 경우 훈련 SageMaker 플랫폼의 집계 메타데이터 수집에 대해 고객에게 알리고 옵트아웃을 선택할 수 있는 옵션을 제공하는 것이 좋습니다. 또는 고객을 대신하여 메타데이터 수집을 옵트아웃할 수 있습니다.
교육을 사용하는 SageMaker 서비스의 클라이언트 또는 고객인 경우
SageMaker 훈련을 사용하는 서비스의 클라이언트 또는 고객인 경우 이전 섹션에서 선호하는 방법을 사용하여 메타데이터 수집을 옵트아웃합니다.