데이터 삭제 작업을 사용하여 사용자 및 해당 데이터 삭제

데이터를 가져온 후 데이터세트 그룹에서 메타데이터 및 상호 작용 데이터를 포함한 사용자 및 해당 데이터를 삭제할 수 있습니다. 규정 준수 프로그램의 일부로 사용자 데이터를 삭제하거나, 사용자 삭제 요청을 처리하거나, 사용자 기반이 변경될 때 데이터를 최신 상태로 유지할 수 있습니다.

사용자를 삭제한 후 Amazon Personalize는 더 이상 데이터를 학습시키지 않으며 사용자 세그먼트를 생성할 때 사용자를 더 이상 고려하지 않습니다.

Amazon Personalize 데이터세트의 사용자 및 데이터세트 그룹의 모델에 대한 참조를 삭제하려면 다음을 수행합니다.

USER_ID 열에서 삭제할 사용자의 userId를 나열하는 CSV 파일을 준비합니다.
Amazon S3 버킷에 CSV 파일을 업로드합니다. Amazon Personalize 서비스 역할에는 이 버킷에 액세스할 수 있는 권한이 있어야 합니다.
데이터 삭제 작업을 생성합니다. 데이터 삭제 작업은 데이터세트 그룹의 모델 및 데이터세트에서 사용자와 해당 데이터를 삭제하는 배치 작업입니다.

지침 및 요구 사항

다음은 사용자를 삭제하기 위한 지침 및 요구 사항입니다.

데이터 삭제 작업을 생성하기 전에 학습 작업, 배치 작업 또는 대량 또는 개별 가져오기 작업과 같이 데이터세트를 사용하는 작업이 진행 중이지 않은지 확인합니다. 또한 데이터 삭제 작업이 진행되는 동안에는 이러한 작업을 생성하지 마세요. 학습 또는 가져오기가 발생하는 경우 사용자의 데이터가 모델에서 삭제될 것이라고 보장할 수 없으며 추가 데이터 삭제 작업을 생성하는 것이 좋습니다.
데이터 삭제 작업은 Amazon Personalize 외부 사용자에 대한 참조를 삭제하지 않습니다. 예를 들어 Amazon S3 버킷의 배치 추천 사항에서 userId를 삭제하지 않습니다. 이러한 레코드는 수동으로 삭제해야 합니다.
상태가 PENDING인 데이터세트 그룹에 대해 최대 5개의 삭제 작업을 가질 수 있습니다.
데이터 삭제 입력 파일의 최대 총 크기는 100MB입니다. 삭제 작업을 생성할 때 동일한 입력 파일을 재사용할 수 있습니다.
각 데이터 삭제 작업은 데이터세트 그룹에서 사용자 및 해당 상호 작용 데이터를 삭제합니다. 모든 데이터세트 그룹에서 데이터를 삭제하려면 각 데이터세트 그룹에 대한 데이터 삭제 작업을 생성해야 합니다.
작업을 생성한 후 데이터세트 및 모델에서 사용자의 데이터를 삭제하는 데 최대 1일이 걸릴 수 있습니다.
작업이 완료되면 사용자 지정 리소스를 업데이트해야 합니다. 새 솔루션 버전을 생성하고 필요한 경우 캠페인을 업데이트해야 합니다. 자동 학습을 사용하는 경우에도 새 솔루션 버전을 수동으로 생성할 수 있습니다.
Amazon Personalize 서비스 역할에는 삭제할 사용자 목록이 있는 Amazon S3 버킷에 액세스할 수 있는 권한이 있어야 합니다. 버킷 및 해당 콘텐츠에 대한 GetObject 및 ListBucket 권한이 필요합니다. 이러한 권한은 데이터 가져오기와 동일합니다. 권한 부여 및 정책 예제에 대한 자세한 내용은 Personalize에 S3 리소스에 대한 액세스 권한 부여 섹션을 참조하세요.
삭제할 사용자의 userIds 목록을 저장하는 Amazon S3 버킷에서는 자체 AWS Key Management Service 키를 사용할 수 없습니다.
항목이 항목 상호 작용 데이터세트에만 나타나고 삭제하려는 사용자만 이 항목과 상호 작용하면 이 항목이 더 이상 추천 사항에 표시되지 않습니다.

삭제할 사용자 목록 준비

Amazon Personalize에서 사용자를 삭제하기 전에 CSV 파일에서 삭제할 사용자 목록을 준비하고 Amazon S3에 업로드해야 합니다.

삭제 및 업로드할 사용자 목록을 준비하려면

삭제할 사용자의 userId를 나열하는 CSV 파일을 생성합니다. 다음은 CSV 파일의 형식을 지정하는 방법을 보여줍니다.
```
USER_ID
abc
2a
5basc
ab35
123f
a55d
0v22
441fa
efg
```
CSV 파일을 Amazon Simple Storage Service(S3) 버킷에 업로드합니다. Amazon S3로 파일 업로드에 대한 자세한 내용은 Amazon Simple Storage Service 사용 설명서의 드래그 앤 드롭을 사용하여 파일 및 폴더 업로드 섹션을 참조하세요.
Amazon Personalize에 버킷 및 CSV 파일에 대한 액세스 권한을 부여합니다. Amazon Personalize에는 버킷 및 해당 콘텐츠에서 GetObject 및 ListBucket 작업을 수행할 수 있는 권한이 있어야 합니다. 이러한 권한은 데이터 가져오기와 동일합니다. 권한 부여 및 정책 예제에 대한 자세한 내용은 Personalize에 S3 리소스에 대한 액세스 권한 부여 섹션을 참조하세요.

데이터 삭제 작업 생성

삭제할 사용자 목록 준비를 완료하면 데이터 삭제 작업이 있는 사용자를 삭제할 준비가 된 것입니다.

데이터 삭제 작업은 데이터세트 그룹의 모델 및 데이터세트에서 사용자와 해당 데이터를 삭제하는 배치 작업입니다. 사용자를 삭제한 후 Amazon Personalize는 더 이상 데이터를 학습시키지 않으며 사용자 세그먼트를 생성할 때 사용자를 더 이상 고려하지 않습니다.

데이터 삭제 작업을 생성할 때 삭제할 사용자 목록의 Amazon S3 위치를 지정합니다.

데이터가 단일 파일에 있는 경우 Amazon S3 위치에 다음 구문을 사용합니다.

s3://amzn-s3-demo-bucket/<folder path>/<CSV filename>.csv
CSV 파일이 Amazon S3 버킷의 폴더에 있는 경우 폴더 경로를 지정할 수 있습니다. 데이터 삭제 작업을 통해 Amazon Personalize는 폴더 및 모든 하위 폴더에 .csv 파일 확장명이 있는 모든 파일을 사용합니다. 다른 유형의 파일은 무시합니다. 폴더 이름 뒤에 /가 있는 다음 구문을 사용하세요.

s3://amzn-s3-demo-bucket/<folder path>/

사용하는 역할에는 Amazon S3 버킷 및 해당 콘텐츠에서 GetObject 및 ListBucket 작업을 수행할 수 있는 권한이 있어야 합니다. 권한 부여 및 정책 예제에 대한 자세한 내용은 Personalize에 S3 리소스에 대한 액세스 권한 부여 섹션을 참조하세요.

Personalize 콘솔, AWS Command Line Interface (AWS CLI) 또는 AWS SDKs.

Amazon Personalize 콘솔을 사용하여 사용자를 삭제하려면 이름, IAM 서비스 역할, 데이터의 Amazon S3 위치를 사용하여 데이터 삭제 작업을 생성합니다.

레코드를 삭제하려면(콘솔)

https://console.aws.amazon.com/personalize/home에서 Amazon Personalize 콘솔을 열고 계정에 로그인합니다.
데이터세트 그룹 페이지에서 데이터세트 그룹을 선택합니다. 데이터세트 그룹 개요가 표시됩니다.
탐색 창에서 데이터세트를 선택합니다.
데이터 삭제 작업에서 작업 생성을 선택합니다.
작업 세부 정보에서 작업에 이름을 지정합니다.
S3 입력 소스의 S3 위치에서 삭제할 사용자의 userId 목록을 저장하는 CSV 파일의 Amazon S3 위치를 지정합니다. 삭제할 사용자 목록 준비에서 이 파일을 준비했습니다.
IAM 역할에서 새 역할 생성 또는 기존 역할 사용 중 하나를 선택합니다. Amazon Personalize에 대한 역할을 생성하기 위한 사전 조건을 완료하고 Amazon S3 버킷에 대한 이 역할 액세스 권한을 부여한 경우 기존 서비스 역할 사용을 선택하고 Personalize에 대한 IAM 역할 생성에서 생성한 역할을 지정합니다.

사용하는 역할에는 Amazon S3 버킷 및 해당 콘텐츠에서 GetObject 및 ListBucket 작업을 수행할 수 있는 권한이 있어야 합니다. 이러한 권한은 데이터 가져오기와 동일합니다. 권한 부여 및 정책 예제에 대한 자세한 내용은 Personalize에 S3 리소스에 대한 액세스 권한 부여 섹션을 참조하세요.
태그의 경우, 원하는 태그를 추가할 수 있습니다. Personalize 리소스 태그 지정에 대한 자세한 내용은 Personalize 리소스에 태그 지정단원을 참조하세요.
작업 생성을 선택합니다. 작업이 시작되고 세부 정보 페이지가 표시됩니다.

작업을 생성한 후 데이터세트 및 모델에서 사용자의 데이터를 삭제하는 데 하루 정도 걸릴 수 있습니다. 작업이 완료될 때까지 Amazon Personalize는 학습 시 데이터를 계속 사용합니다. 또한 사용자가 사용자 세그먼트에 표시될 수 있습니다.

상태가 COMPLETED로 표시되면 데이터 삭제가 완료된 것입니다. 어떤 이유로든 작업이 실패하면 다른 데이터 삭제 작업을 생성하는 것이 좋습니다. 작업이 완료되면 사용자 지정 리소스를 업데이트해야 합니다. 새 솔루션 버전을 생성하고 필요한 경우 캠페인을 업데이트해야 합니다. 자동 학습을 사용하는 경우에도 새 솔루션 버전을 수동으로 생성할 수 있습니다.

를 사용하여 사용자를 삭제하려면 create-data-deletion-job 명령을 AWS CLI사용합니다. 이 명령은 CreateDataDeletion API 작업을 사용합니다. 다음 코드 예는 데이터 삭제 작업을 생성하는 방법을 보여줍니다. 코드를 사용하려면 코드를 업데이트하여 작업 이름, Personalize에 대한 IAM 역할 생성에서 생성한 IAM 역할 및 데이터의 Amazon S3 위치를 지정합니다. 삭제할 사용자 목록 준비에서 이 파일을 준비했습니다.


aws personalize create-data-deletion-job \
--job-name deletion job name \
--dataset-group-arn dataset group ARN \
--data-source dataLocation=s3://amzn-s3-demo-bucket/filename.csv \
--role-arn roleArn

작업을 생성한 후 데이터세트 및 모델에서 사용자의 데이터를 삭제하는 데 하루 정도 걸릴 수 있습니다. 작업이 완료될 때까지 Amazon Personalize는 학습 시 데이터를 계속 사용합니다. 또한 사용자가 사용자 세그먼트에 표시될 수 있습니다.

상태가 COMPLETED이면 작업이 완료된 것입니다. describe-data-deletion-job 명령을 사용하여 상태를 확인하고 데이터 삭제 작업 ARN을 지정합니다. 이러한 API 작업에 대한 자세한 내용은 DescribeDataDeletionJob 섹션을 참조하세요. 생성 시간별로 정렬된 데이터 삭제 작업 기록을 보려면 ListDataDeletionJobs API 작업을 사용합니다.

어떤 이유로든 작업이 실패하면 다른 데이터 삭제 작업을 생성하는 것이 좋습니다. 작업이 완료되면 사용자 지정 리소스를 업데이트해야 합니다. 새 솔루션 버전을 생성하고 필요한 경우 캠페인을 업데이트해야 합니다. 자동 학습을 사용하는 경우에도 새 솔루션 버전을 수동으로 생성할 수 있습니다.

AWS SDKs를 사용하여 사용자를 삭제하려면 CreateDataDeletionJob API 작업을 사용합니다. 다음 코드 예는 데이터 삭제 작업을 생성하는 방법을 보여줍니다. 코드를 사용하려면 코드를 업데이트하여 작업 이름, Personalize에 대한 IAM 역할 생성에서 생성한 IAM 역할 및 데이터의 Amazon S3 위치를 지정합니다. 삭제할 사용자 목록 준비에서 이 파일을 준비했습니다.


import boto3

personalize = boto3.client('personalize')

response = personalize.create_data_deletion_job(
    jobName = 'Deletion job name',
    datasetGroupArn = 'Dataset Group ARN',
    dataSource = {'dataLocation':'s3://amzn-s3-demo-bucket/file.csv'},
    roleArn = 'role_arn'
)

deletion_job_arn = response['dataDeletionJobArn']

print ('Deletion Job arn: ' + deletion_job_arn)

description = personalize.describe_data_deletion_job(
    dataDeletionJobArn = deletion_job_arn)['dataDeletionJob']

print('Name: ' + description['jobName'])
print('ARN: ' + description['dataDeletionJobArn'])
print('Status: ' + description['status'])

상태가 COMPLETED이면 작업이 완료된 것입니다. DescribeDataDeletionJob 작업을 사용하여 상태를 확인하고 데이터 삭제 작업 ARN을 지정합니다. 생성 시간별로 정렬된 데이터 삭제 작업 기록을 보려면 ListDataDeletionJobs API 작업을 사용합니다.

javascript가 브라우저에서 비활성화되거나 사용이 불가합니다.

AWS 설명서를 사용하려면 Javascript가 활성화되어야 합니다. 지침을 보려면 브라우저의 도움말 페이지를 참조하십시오.

문서 규칙

리소스 삭제

데이터 세트 삭제