데이터 삭제 작업을 통한 사용자 및 데이터 삭제 - Personalize

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

데이터 삭제 작업을 통한 사용자 및 데이터 삭제

데이터를 가져온 후 데이터세트 그룹에서 메타데이터 및 상호작용 데이터를 포함한 사용자 및 해당 데이터를 삭제할 수 있습니다. 규정 준수 프로그램의 일환으로, 사용자 삭제 요청을 처리하기 위해 또는 사용자 기반 변화에 따라 데이터를 최신 상태로 유지하기 위해 사용자 데이터를 삭제할 수 있습니다.

사용자를 삭제하면 Amazon Personalize는 더 이상 사용자 데이터를 트레이닝하지 않으며 사용자 세그먼트를 생성할 때 사용자를 고려하지 않습니다.

Amazon Personalize 데이터 세트 및 데이터 세트 그룹의 모델에 있는 사용자에 대한 참조를 삭제하려면 다음과 같이 하십시오.

  1. USER_ID 열에 삭제할 사용자의 사용자 ID를 나열하는 CSV 파일을 준비하십시오.

  2. CSV 파일을 Amazon S3 버킷에 업로드합니다. Amazon Personalize 서비스 역할에는 이 버킷에 액세스할 수 있는 권한이 있어야 합니다.

  3. 데이터 삭제 작업을 생성하십시오. 데이터 삭제 작업은 데이터세트 그룹의 모델 및 데이터세트에서 사용자와 해당 데이터를 삭제하는 일괄 작업입니다.

지침 및 요구 사항

다음은 사용자 삭제에 대한 지침 및 요구 사항입니다.

  • 데이터 삭제 작업을 생성하기 전에 데이터세트를 사용하는 작업 (예: 교육 작업, 일괄 작업, 대량 또는 개별 가져오기 작업) 이 진행 중이지 않은지 확인하세요. 그리고 데이터 삭제 작업이 진행 중인 동안에는 이러한 작업을 만들지 마세요. 교육 또는 가져오기가 발생하는 경우 사용자 데이터가 모델에서 삭제된다고 보장할 수 없으므로 추가 데이터 삭제 작업을 생성하는 것이 좋습니다.

  • 데이터 삭제 작업은 Amazon Personalize 외부 사용자에 대한 참조를 삭제하지 않습니다. 예를 들어 Amazon S3 버킷의 배치 추천에서 해당 사용자의 UserID를 삭제하지는 않습니다. 이러한 레코드는 수동으로 삭제해야 합니다.

  • PENDING 상태인 데이터세트 그룹당 최대 5개의 삭제 작업을 수행할 수 있습니다.

  • 데이터 삭제 입력 파일 또는 파일의 최대 총 크기는 50MB입니다. 삭제 작업을 생성할 때 동일한 입력 파일을 재사용할 수 있습니다.

  • 각 데이터 삭제 작업은 데이터세트 그룹에서 사용자와 사용자의 상호작용 데이터를 삭제합니다. 모든 데이터세트 그룹에서 데이터를 삭제하려면 각 데이터세트 그룹에 대한 데이터 삭제 작업을 만들어야 합니다.

  • 작업을 생성한 후 데이터세트와 모델에서 사용자 데이터를 삭제하는 데 최대 하루가 걸릴 수 있습니다.

  • 작업이 완료된 후에는 모든 커스텀 리소스를 업데이트해야 합니다. 새 솔루션 버전을 만들고 필요한 경우 캠페인을 업데이트하세요. 자동 교육을 사용하는 경우에도 새 솔루션 버전을 수동으로 만들 수 있습니다.

  • Amazon Personalize 서비스 역할에는 삭제할 사용자 목록이 있는 Amazon S3 버킷에 액세스할 수 있는 권한이 있어야 합니다. GetObject버킷과 ListBucket 해당 콘텐츠에 대한 필요 및 권한이 필요합니다. 이러한 권한은 데이터 가져오기와 동일합니다. 권한 부여 및 정책 예제에 대한 자세한 내용은 을 참조하십시오. Personalize에 S3 리소스에 대한 액세스 권한 부여

  • 삭제할 사용자의 사용자 ID 목록을 저장하는 Amazon S3 버킷에서는 자체 AWS Key Management Service 키를 사용할 수 없습니다.

  • 항목이 항목 상호 작용 데이터 세트 데이터 세트에만 나타나고 삭제하려는 사용자만 이 항목과 상호 작용한 경우 이 항목은 더 이상 권장 사항에 표시되지 않습니다.

삭제할 사용자 목록 준비

Amazon Personalize에서 사용자를 삭제하기 전에 삭제할 사용자 목록을 CSV 파일로 준비하여 Amazon S3에 업로드해야 합니다.

삭제하고 업로드할 사용자 목록을 준비하려면
  1. 삭제할 사용자의 사용자 ID가 나열된 CSV 파일을 생성합니다. 다음은 CSV 파일의 형식을 지정하는 방법을 보여줍니다.

    USER_ID abc 2a 5basc ab35 123f a55d 0v22 441fa efg
  2. CSV 파일을 아마존 심플 스토리지 서비스 (Amazon S3) 버킷에 업로드합니다. Amazon S3에 파일을 업로드하는 방법에 대한 자세한 내용은 Amazon Simple Storage 서비스 사용 설명서의 드래그 앤 드롭을 사용한 파일 및 폴더 업로드를 참조하십시오.

  3. Amazon Personalize에 버킷과 CSV 파일에 대한 액세스 권한을 부여하십시오. Amazon Personalize에는 버킷 GetObject 및 해당 콘텐츠에 대해 및 ListBucket 작업을 수행할 권한이 있어야 합니다. 이러한 권한은 데이터 가져오기와 동일합니다. 권한 부여 및 정책 예제에 대한 자세한 내용은 을 참조하십시오. Personalize에 S3 리소스에 대한 액세스 권한 부여

데이터 삭제 작업 생성

작업을 삭제할 사용자 목록 준비 완료하고 나면 데이터 삭제 작업으로 사용자를 삭제할 준비가 된 것입니다.

데이터 삭제 작업은 데이터세트 그룹의 모델 및 데이터세트에서 사용자와 해당 데이터를 삭제하는 일괄 작업입니다. 사용자를 삭제하면 Amazon Personalize는 더 이상 사용자 데이터를 트레이닝하지 않으며 사용자 세그먼트를 생성할 때 사용자를 고려하지 않습니다.

데이터 삭제 작업을 생성할 때 삭제할 사용자 목록의 Amazon S3 위치를 지정합니다.

  • 데이터가 단일 파일에 있는 경우 Amazon S3 위치에 다음 구문을 사용하십시오.

    s3://<name of your S3 bucket>/<folder path>/<CSV filename>.csv

  • CSV 파일이 Amazon S3 버킷의 폴더에 있는 경우 폴더 경로를 지정할 수 있습니다. 데이터 삭제 작업에서 Amazon Personalize는 폴더 및 하위 폴더에서 .csv 파일 확장자가 있는 모든 파일을 사용합니다. 다른 유형의 파일은 무시합니다. 폴더 이름 뒤에 /가 있는 다음 구문을 사용하세요.

    s3://<name of your S3 bucket>/<folder path>/

사용하는 역할에는 Amazon S3 버킷 GetObject 및 해당 콘텐츠에서 및 ListBucket 작업을 수행할 수 있는 권한이 있어야 합니다. 권한 부여 및 정책 예제에 대한 자세한 내용은 을 참조하십시오Personalize에 S3 리소스에 대한 액세스 권한 부여.

Amazon Personalize 콘솔, AWS Command Line Interface (AWS CLI) 또는 AWS SDK를 사용하여 데이터 삭제 작업을 생성할 수 있습니다.

Amazon Personalize 콘솔에서 사용자를 삭제하려면 데이터의 이름, IAM 서비스 역할 및 Amazon S3 위치를 사용하여 데이터 삭제 작업을 생성하십시오.

레코드를 삭제하려면 (콘솔)
  1. https://console.aws.amazon.com/acm-pca/home에서 Personalize 콘솔을 열고 계정에 로그인합니다.

  2. 데이터세트 그룹 페이지에서 데이터세트 그룹을 선택합니다. 데이터세트 그룹 개요가 표시됩니다.

  3. 탐색 창에서 데이터세트를 선택합니다.

  4. 데이터 삭제 작업에서 작업 생성을 선택합니다.

  5. Job details (Job details) 에서 작업 이름을 지정합니다.

  6. S3 입력 소스에서 S3 위치에 대해 삭제할 사용자의 사용자 ID 목록을 저장하는 CSV 파일의 Amazon S3 위치를 지정합니다. 에서 이 파일을 준비했습니다. 삭제할 사용자 목록 준비

  7. IAM 역할에서 새 역할 생성 또는 기존 역할 사용 중 하나를 선택합니다. Amazon Personalize용 역할을 생성하기 위한 사전 요구 사항을 완료하고 이 역할에 Amazon S3 버킷에 대한 액세스 권한을 부여한 경우, 기존 서비스 역할 사용을 선택하고 생성한 역할을 지정합니다. Personalize에 대한 IAM 역할 생성

    사용하는 역할에는 Amazon S3 버킷 GetObject 및 해당 콘텐츠에서 및 ListBucket 작업을 수행할 수 있는 권한이 있어야 합니다. 이러한 권한은 데이터 가져오기와 동일합니다. 권한 부여 및 정책 예제에 대한 자세한 내용은 을 참조하십시오. Personalize에 S3 리소스에 대한 액세스 권한 부여

  8. 태그의 경우, 원하는 태그를 추가할 수 있습니다. Personalize 리소스 태그 지정에 대한 자세한 내용은 Personalize 리소스에 태그 지정단원을 참조하세요.

  9. 작업 생성을 선택합니다. 작업이 시작되고 세부 정보 페이지가 표시됩니다.

    작업을 만든 후 데이터세트와 모델에서 사용자 데이터를 삭제하는 데 하루 정도 걸릴 수 있습니다. 작업이 완료될 때까지 Amazon Personalize는 교육 시 데이터를 계속 사용합니다. 또한 사용자가 사용자 세그먼트에 나타날 수도 있습니다.

    상태가 COMPLETED로 표시되면 데이터 삭제가 완료된 것입니다. 어떤 이유로든 작업이 실패할 경우 다른 데이터 삭제 작업을 생성하는 것이 좋습니다. 작업이 완료된 후에는 모든 사용자 지정 리소스를 업데이트해야 합니다. 새 솔루션 버전을 만들고 필요한 경우 캠페인을 업데이트하세요. 자동 교육을 사용하는 경우에도 새 솔루션 버전을 수동으로 만들 수 있습니다.

를 AWS CLI사용하여 사용자를 삭제하려면 create-data-deletion-job 명령을 사용합니다. 이 명령은 CreateDataDeletion API 작업을 사용합니다. 다음 코드는 데이터 삭제 작업을 생성하는 방법을 보여줍니다. 코드를 사용하려면 코드를 업데이트하여 작업 이름, 생성한 IAM 역할Personalize에 대한 IAM 역할 생성, 데이터의 Amazon S3 위치를 지정하십시오. 에서 이 파일을 준비했습니다삭제할 사용자 목록 준비.

aws personalize create-data-deletion-job \ --job-name deletion job name \ --dataset-group-arn dataset group ARN \ --data-source dataLocation=s3://bucketname/filename.csv \ --role-arn roleArn

작업을 만든 후 데이터세트와 모델에서 사용자 데이터를 삭제하는 데 하루 정도 걸릴 수 있습니다. 작업이 완료될 때까지 Amazon Personalize는 교육 시 데이터를 계속 사용합니다. 또한 사용자가 사용자 세그먼트에 나타날 수도 있습니다.

상태가 완료되면 작업이 완료된 것입니다. describe-data-deletion-job명령을 사용하여 상태를 확인하고 데이터 삭제 작업 ARN을 지정합니다. API 작업에 대한 자세한 내용은 을 참조하십시오DescribeDataDeletionJob. 생성 시간별로 정렬된 데이터 삭제 작업 기록을 보려면 ListDataDeletionJobs API 작업을 사용하십시오.

어떤 이유로든 작업이 실패할 경우 다른 데이터 삭제 작업을 생성하는 것이 좋습니다. 작업이 완료된 후에는 모든 사용자 지정 리소스를 업데이트해야 합니다. 새 솔루션 버전을 만들고 필요한 경우 캠페인을 업데이트하세요. 자동 교육을 사용하는 경우에도 새 솔루션 버전을 수동으로 만들 수 있습니다.

AWS SDK를 사용하여 사용자를 삭제하려면 CreateDataDeletionJob API 작업을 사용하십시오. 다음 코드는 데이터 삭제 작업을 생성하는 방법을 보여줍니다. 코드를 사용하려면 코드를 업데이트하여 작업 이름, 생성한 IAM 역할Personalize에 대한 IAM 역할 생성, 데이터의 Amazon S3 위치를 지정하십시오. 에서 이 파일을 준비했습니다삭제할 사용자 목록 준비.

import boto3 personalize = boto3.client('personalize') response = personalize.create_data_deletion_job( jobName = 'Deletion job name', datasetGroupArn = 'Dataset Group ARN', dataSource = {'dataLocation':'s3://bucket/file.csv'}, roleArn = 'role_arn' ) deletion_job_arn = response['dataDeletionJobArn'] print ('Deletion Job arn: ' + deletion_job_arn) description = personalize.describe_data_deletion_job( dataDeletionJobArn = deletion_job_arn)['dataDeletionJob'] print('Name: ' + description['jobName']) print('ARN: ' + description['dataDeletionJobArn']) print('Status: ' + description['status'])

작업을 만든 후 데이터세트와 모델에서 사용자 데이터를 삭제하는 데 하루 정도 걸릴 수 있습니다. 작업이 완료될 때까지 Amazon Personalize는 교육 시 데이터를 계속 사용합니다. 또한 사용자가 사용자 세그먼트에 나타날 수도 있습니다.

상태가 완료되면 작업이 완료된 것입니다. DescribeDataDeletionJob작업을 사용하여 상태를 확인하고 데이터 삭제 작업 ARN을 지정합니다. 생성 시간별로 정렬된 데이터 삭제 작업 기록을 보려면 ListDataDeletionJobs API 작업을 사용하십시오.

어떤 이유로든 작업이 실패할 경우 다른 데이터 삭제 작업을 생성하는 것이 좋습니다. 작업이 완료된 후에는 모든 사용자 지정 리소스를 업데이트해야 합니다. 새 솔루션 버전을 만들고 필요한 경우 캠페인을 업데이트하세요. 자동 교육을 사용하는 경우에도 새 솔루션 버전을 수동으로 만들 수 있습니다.