使用資料刪除任務刪除使用者及其資料 - Amazon Personalize

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

使用資料刪除任務刪除使用者及其資料

匯入資料後,您可以從資料集群組刪除使用者及其資料,包括其中繼資料和互動資料。您可以刪除使用者資料作為合規計畫的一部分,或處理使用者刪除請求,或隨著使用者基礎變更保持資料為最新狀態。

刪除使用者後,Amazon Personalize 不會再訓練其資料,也不會在產生使用者區段時考慮使用者。

若要刪除 Amazon Personalize 資料集中的使用者參考,以及資料集群組中的模型,請執行下列動作:

  1. 準備CSV檔案,列出在 USER_ID 欄中要刪除的使用者 userIds 。

  2. 將CSV檔案上傳至 Amazon S3 儲存貯體。您的 Amazon Personalize 服務角色必須具有存取此儲存貯體的許可。

  3. 建立資料刪除任務。資料刪除任務是一種批次任務,可從資料集群組中的模型和資料集刪除使用者及其資料。

指導方針和要求

以下是刪除使用者的指導方針和要求:

  • 在您建立資料刪除任務之前,請確定沒有使用資料集的任務正在進行中,例如訓練任務、批次任務,或大量或個別匯入操作。並避免在資料刪除任務進行時建立此類任務。如果發生任何訓練或匯入,我們無法保證會從模型中刪除使用者的資料,而且建議您建立額外的資料刪除任務。

  • 資料刪除任務不會刪除對 Amazon Personalize 外部使用者的參考。例如,它不會userId從 Amazon S3 儲存貯體中的批次建議中刪除它們。您必須手動刪除這些記錄。

  • 對於狀態為 的資料集群組,您最多可以有 5 個刪除任務PENDING。

  • 資料刪除輸入檔案或檔案的總大小上限為 100 MB。您可以在建立刪除任務時重複使用相同的輸入檔案。

  • 每個資料刪除任務都會刪除資料集群組中的使用者及其互動資料。若要刪除所有資料集群組中的資料,您必須為每個資料集群組建立資料刪除任務。

  • 建立任務後,從資料集和模型中刪除使用者的資料最多可能需要一天的時間。

  • 任務完成後,請務必更新任何自訂資源。請務必建立新的解決方案版本,並視需要更新您的行銷活動。如果您使用自動訓練,您仍然可以手動建立新的解決方案版本。

  • 您的 Amazon Personalize 服務角色必須具有存取 Amazon S3 儲存貯體的許可,其中包含要刪除的使用者清單。它需要GetObject儲存貯體及其內容的 和 ListBucket 許可。這些許可與匯入資料相同。如需授予許可和政策範例的詳細資訊,請參閱讓 Amazon Personalize 化訪問 Amazon S3 資源

  • 您無法在存放要刪除之使用者清單 userIds 的 Amazon S3 儲存貯體上使用自己的 AWS Key Management Service 金鑰。

  • 如果項目僅出現在您的項目互動資料集中,且只有您刪除的使用者與此項目互動,則此項目將不再出現在建議中。

準備要刪除的使用者清單

從 Amazon Personalize 刪除使用者之前,您必須準備要刪除CSV檔案中的使用者清單,並將其上傳至 Amazon S3。

準備要刪除並上傳的使用者清單
  1. 建立CSV檔案,列出要刪除 userIds 的使用者的 。以下顯示您的CSV檔案必須格式化的方式。

    USER_ID abc 2a 5basc ab35 123f a55d 0v22 441fa efg
  2. 將CSV檔案上傳至 Amazon Simple Storage Service (Amazon S3) 儲存貯體。如需將檔案上傳至 Amazon S3 的詳細資訊,請參閱《Amazon Simple Storage Service 使用者指南》中的使用拖放功能上傳檔案和資料夾

  3. 讓 Amazon Personalize 存取您的儲存貯體和 CSV 檔案。Amazon Personalize 必須具有許可,才能在您的儲存貯體及其內容上執行 和 GetObjectListBucket動作。這些許可與匯入資料相同。如需授予許可和政策範例的詳細資訊,請參閱 讓 Amazon Personalize 化訪問 Amazon S3 資源

建立資料刪除任務

完成 後準備要刪除的使用者清單,您就可以刪除具有資料刪除任務的使用者。

資料刪除任務是一種批次任務,可從資料集群組中的模型和資料集刪除使用者及其資料。刪除使用者後,Amazon Personalize 不會再訓練其資料,也不會在產生使用者區段時考慮使用者。

當您建立資料刪除任務時,您可以指定要刪除的使用者清單的 Amazon S3 位置。

  • 如果您的資料位於單一檔案中,請使用 Amazon S3 位置的下列語法:

    s3://amzn-s3-demo-bucket/<folder path>/<CSV filename>.csv

  • 如果您的CSV檔案位於 Amazon S3 儲存貯體的資料夾中,您可以指定資料夾的路徑。對於資料刪除任務,Amazon Personalize 會使用 資料夾和任何子資料夾中具有.csv副檔名的所有檔案。它會忽略任何其他類型的檔案。使用下列語法搭配 資料夾名稱/後面的 :

    s3://amzn-s3-demo-bucket/<folder path>/

您使用的角色必須具有許可,才能在 Amazon S3 儲存貯體及其內容上執行 和 GetObjectListBucket動作。如需授予許可和政策範例的詳細資訊,請參閱讓 Amazon Personalize 化訪問 Amazon S3 資源

您可以使用 Amazon Personalize 主控台、 AWS Command Line Interface (AWS CLI) 或 建立資料刪除任務 AWS SDKs。

若要使用 Amazon Personalize 主控台刪除使用者,請使用資料的名稱、IAM服務角色和 Amazon S3 位置來建立資料刪除任務。

刪除記錄 (主控台)
  1. https://console.aws.amazon.com/personalize/在家中開啟 Amazon Personalize 主控台並登入您的帳戶。

  2. 資料集群組頁面上,選擇您的資料集群組。顯示資料集群組概觀

  3. 在導覽窗格中,選擇資料集

  4. 資料刪除任務中,選擇建立任務

  5. 任務詳細資訊中,為任務命名。

  6. S3 輸入來源S3 位置中,指定儲存要刪除之使用者清單CSV的檔案 userIds 的 Amazon S3 位置。您已在 中準備此檔案準備要刪除的使用者清單

  7. IAM角色中,選擇建立新的角色或使用現有的角色。如果您完成建立 Amazon Personalize 角色的先決條件,並授予此角色存取 Amazon S3 儲存貯體的權限,請選擇使用現有的服務角色,並指定您在 中建立的角色建立 Amazon Personalize IAM的角色

    您使用的角色必須具有許可,才能在 Amazon S3 儲存貯體及其內容上執行 和 GetObjectListBucket動作。這些許可與匯入資料相同。如需授予許可和政策範例的詳細資訊,請參閱讓 Amazon Personalize 化訪問 Amazon S3 資源

  8. 對於標籤,選擇性地新增任何標籤。如需標記 Amazon Personalize 資源的詳細資訊,請參閱 標記 Amazon Personalize 化資

  9. 選擇建立作業。任務開始,並顯示詳細資訊頁面。

    建立任務之後,從資料集和模型中刪除使用者的資料大約需要一天的時間。在任務完成之前,Amazon Personalize 會在訓練時繼續使用資料。使用者可能會出現在使用者區段中。

    當狀態顯示為 時,資料刪除即完成COMPLETED。如果任務因任何原因失敗,我們建議您建立另一個資料刪除任務。任務完成後,請務必更新任何自訂資源。請務必建立新的解決方案版本,並視需要更新您的行銷活動。如果您使用自動訓練,您仍然可以手動建立新的解決方案版本。

若要使用 刪除使用者 AWS CLI,請使用 create-data-deletion-job命令。此命令使用 CreateDataDeletion API操作。下列程式碼說明如何建立資料刪除任務。若要使用程式碼,請更新它以指定任務名稱、您在 中建立IAM的角色建立 Amazon Personalize IAM的角色,以及資料的 Amazon S3 位置。您已在 中準備此檔案準備要刪除的使用者清單

aws personalize create-data-deletion-job \ --job-name deletion job name \ --dataset-group-arn dataset group ARN \ --data-source dataLocation=s3://amzn-s3-demo-bucket/filename.csv \ --role-arn roleArn

建立任務之後,從資料集和模型中刪除使用者的資料大約可以有一天的時間。在任務完成之前,Amazon Personalize 會在訓練時繼續使用資料。使用者可能會出現在使用者區段中。

當狀態為 時,任務即完成COMPLETED。使用 describe-data-deletion-job命令檢查狀態,並指定資料刪除任務 ARN。如需 API操作的詳細資訊,請參閱 DescribeDataDeletionJob。若要檢視依建立時間排序的資料刪除任務歷史記錄,請使用 ListDataDeletionJobsAPI操作。

如果任務因任何原因失敗,我們建議您建立另一個資料刪除任務。任務完成後,請務必更新任何自訂資源。請務必建立新的解決方案版本,並視需要更新您的行銷活動。如果您使用自動訓練,您仍然可以手動建立新的解決方案版本。

若要使用 刪除使用者 AWS SDKs,請使用 CreateDataDeletionJobAPI操作。下列程式碼說明如何建立資料刪除任務。若要使用程式碼,請更新它以指定任務名稱、您在 中建立IAM的角色建立 Amazon Personalize IAM的角色,以及資料的 Amazon S3 位置。您已在 中準備此檔案準備要刪除的使用者清單

import boto3 personalize = boto3.client('personalize') response = personalize.create_data_deletion_job( jobName = 'Deletion job name', datasetGroupArn = 'Dataset Group ARN', dataSource = {'dataLocation':'s3://amzn-s3-demo-bucket/file.csv'}, roleArn = 'role_arn' ) deletion_job_arn = response['dataDeletionJobArn'] print ('Deletion Job arn: ' + deletion_job_arn) description = personalize.describe_data_deletion_job( dataDeletionJobArn = deletion_job_arn)['dataDeletionJob'] print('Name: ' + description['jobName']) print('ARN: ' + description['dataDeletionJobArn']) print('Status: ' + description['status'])

建立任務之後,從資料集和模型中刪除使用者的資料大約可以有一天的時間。在任務完成之前,Amazon Personalize 會在訓練時繼續使用資料。使用者可能會出現在使用者區段中。

當狀態為 時,任務即完成COMPLETED。使用 DescribeDataDeletionJob操作來檢查狀態,並指定資料刪除任務 ARN。若要檢視依建立時間排序的資料刪除任務歷史記錄,請使用 ListDataDeletionJobsAPI操作。

如果任務因任何原因失敗,我們建議您建立另一個資料刪除任務。任務完成後,請務必更新任何自訂資源。請務必建立新的解決方案版本,並視需要更新您的行銷活動。如果您使用自動訓練,您仍然可以手動建立新的解決方案版本。