Eliminazione degli utenti e dei relativi dati con un processo di eliminazione dei dati - Amazon Personalize

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Eliminazione degli utenti e dei relativi dati con un processo di eliminazione dei dati

Dopo aver importato i dati, puoi eliminare gli utenti e i relativi dati, inclusi i metadati e i dati di interazione, da un gruppo di set di dati. È possibile eliminare i dati degli utenti come parte di un programma di conformità, per soddisfare le richieste di eliminazione degli utenti o per mantenere i dati aggiornati man mano che la base utenti cambia.

Dopo aver eliminato gli utenti, Amazon Personalize non si basa più sui loro dati e non li considera più durante la generazione di segmenti di utenti.

Per eliminare i riferimenti agli utenti nei set di dati e nei modelli di Amazon Personalize in un gruppo di set di dati, procedi come segue:

  1. Prepara un CSV file che elenchi gli userIds utenti da eliminare in una USER colonna _ID.

  2. Carica il CSV file in un bucket Amazon S3. Il tuo ruolo di servizio Amazon Personalize deve avere l'autorizzazione per accedere a questo bucket.

  3. Crea un processo di eliminazione dei dati. Un processo di eliminazione dei dati è un processo in batch che elimina gli utenti e i relativi dati dai modelli e dai set di dati in un gruppo di set di dati.

Linee guida e requisiti

Di seguito sono riportate le linee guida e i requisiti per l'eliminazione degli utenti:

  • Prima di creare un processo di eliminazione dei dati, assicurati che non sia in corso alcun processo che utilizza i tuoi set di dati, ad esempio lavori di formazione, lavori in batch o operazioni di importazione collettive o individuali. Inoltre, evita di creare tali lavori mentre è in corso un processo di eliminazione dei dati. In caso di formazione o importazione, non possiamo garantire che i dati degli utenti vengano eliminati dai modelli e consigliamo di creare un processo di eliminazione dei dati aggiuntivo.

  • Un processo di eliminazione dei dati non elimina i riferimenti a utenti esterni ad Amazon Personalize. Ad esempio, non elimina i loro consigli userId dal batch nel tuo bucket Amazon S3. È necessario eliminare manualmente questi record.

  • È possibile avere fino a 5 processi di eliminazione per un gruppo di set di dati con uno stato diPENDING.

  • La dimensione totale massima del file o dei file di input per la cancellazione dei dati è 100 MB. È possibile riutilizzare lo stesso file di input durante la creazione dei processi di eliminazione.

  • Ogni processo di eliminazione dei dati elimina gli utenti e i relativi dati di interazione in un gruppo di set di dati. Per eliminare i loro dati in tutti i gruppi di set di dati, è necessario creare un processo di eliminazione dei dati per ogni gruppo di set di dati.

  • Dopo aver creato un processo, l'eliminazione dei dati degli utenti da set di dati e modelli può richiedere fino a un giorno.

  • Al termine di un processo, assicurati di aggiornare tutte le risorse personalizzate. Assicurati di creare una nuova versione della soluzione e, se necessario, di aggiornare la campagna. Se utilizzi la formazione automatica, puoi comunque creare manualmente nuove versioni della soluzione.

  • Il tuo ruolo di servizio Amazon Personalize deve avere l'autorizzazione ad accedere al tuo bucket Amazon S3 con l'elenco di utenti da eliminare. Ha bisogno di autorizzazioni GetObject e ListBucket autorizzazioni per il bucket e il suo contenuto. Queste autorizzazioni sono le stesse dell'importazione dei dati. Per informazioni sulla concessione di autorizzazioni ed esempi di policy, consulta. Offrire ad Amazon Personalize l'accesso alle risorse di Amazon S3

  • Non puoi usare la tua AWS Key Management Service chiave nel bucket Amazon S3 che memorizza l'elenco userIds degli utenti da eliminare.

  • Se un elemento appare solo nel set di dati sulle interazioni tra oggetti e solo gli utenti che stai eliminando hanno interagito con questo elemento, questo elemento non verrà più visualizzato nei consigli.

Preparazione di un elenco di utenti da eliminare

Prima di eliminare utenti da Amazon Personalize, devi preparare un elenco di utenti da eliminare in un CSV file e caricarlo su Amazon S3.

Per preparare l'elenco di utenti da eliminare e caricare
  1. Crea un CSV file che elenchi userIds gli utenti da eliminare. Di seguito viene illustrato come deve essere formattato il CSV file.

    USER_ID abc 2a 5basc ab35 123f a55d 0v22 441fa efg
  2. Carica il CSV file in un bucket Amazon Simple Storage Service (Amazon S3). Per ulteriori informazioni sul caricamento di file su Amazon S3, consulta Caricamento di file e cartelle tramite Drag and Drop nella Guida per l'utente di Amazon Simple Storage Service.

  3. Consenti ad Amazon Personalize di accedere al tuo bucket e al tuo file. CSV Amazon Personalize deve essere autorizzato a eseguire ListBucket le azioni GetObject and sul bucket e sul suo contenuto. Queste autorizzazioni sono le stesse dell'importazione di dati. Per informazioni sulla concessione di autorizzazioni ed esempi di policy, consulta. Offrire ad Amazon Personalize l'accesso alle risorse di Amazon S3

Creazione di un processo di eliminazione dei dati

Al terminePreparazione di un elenco di utenti da eliminare, sei pronto per eliminare gli utenti con un processo di eliminazione dei dati.

Un processo di eliminazione dei dati è un processo in batch che elimina gli utenti e i relativi dati dai modelli e dai set di dati in un gruppo di set di dati. Dopo aver eliminato gli utenti, Amazon Personalize non si basa più sui loro dati e non li considera più durante la generazione di segmenti di utenti.

Quando crei un processo di eliminazione dei dati, specifichi la posizione Amazon S3 dell'elenco di utenti da eliminare.

  • Se i dati sono in un unico file, utilizza la seguente sintassi per la posizione Amazon S3:

    s3://amzn-s3-demo-bucket/<folder path>/<CSV filename>.csv

  • Se CSV i tuoi file si trovano in una cartella del tuo bucket Amazon S3, puoi specificare il percorso della cartella. Con un processo di eliminazione dei dati, Amazon Personalize utilizza tutti i file con estensione nella cartella e in qualsiasi sottocartella. .csv Ignora i file di qualsiasi altro tipo. Utilizzate la seguente sintassi con una / dopo il nome della cartella:

    s3://amzn-s3-demo-bucket/<folder path>/

Il ruolo che utilizzi deve avere l'autorizzazione per eseguire le ListBucket azioni GetObject and sul tuo bucket Amazon S3 e sul suo contenuto. Per informazioni sulla concessione di autorizzazioni ed esempi di policy, consulta. Offrire ad Amazon Personalize l'accesso alle risorse di Amazon S3

Puoi creare un processo di eliminazione dei dati con la console Amazon Personalize, il AWS Command Line Interface (AWS CLI) o. AWS SDKs

Per eliminare utenti con la console Amazon Personalize, crea un processo di eliminazione dei dati con un nome, il ruolo del IAM servizio e la posizione Amazon S3 dei tuoi dati.

Per eliminare i record (console)
  1. Apri la console Amazon Personalize a https://console.aws.amazon.com/personalize/casa e accedi al tuo account.

  2. Nella pagina dei gruppi di set di dati, scegli il tuo gruppo di set di dati. Viene visualizzata la panoramica del gruppo di set di dati.

  3. Nel riquadro di navigazione, scegli Set di dati.

  4. In Processi di eliminazione dei dati, scegli Crea lavoro.

  5. In Dettagli del lavoro, assegna un nome al lavoro.

  6. In S3 Input source, per S3 Location, specifica la posizione Amazon S3 del CSV file che memorizza l'elenco userIds degli utenti da eliminare. Hai preparato questo file in. Preparazione di un elenco di utenti da eliminare

  7. Nel IAMruolo, scegli se creare un nuovo ruolo o usarne uno esistente. Se hai completato i prerequisiti per creare un ruolo per Amazon Personalize e hai concesso a questo ruolo l'accesso al tuo bucket Amazon S3, scegli Usa un ruolo di servizio esistente e specifica il ruolo in cui hai creato. Creare un IAM ruolo per Amazon Personalize

    Il ruolo che utilizzi deve avere l'autorizzazione per eseguire le ListBucket azioni GetObject and sul tuo bucket Amazon S3 e sul suo contenuto. Queste autorizzazioni sono le stesse dell'importazione di dati. Per informazioni sulla concessione di autorizzazioni ed esempi di policy, consulta. Offrire ad Amazon Personalize l'accesso alle risorse di Amazon S3

  8. Per i tag, aggiungi facoltativamente qualsiasi tag. Per ulteriori informazioni sull'etichettatura delle risorse Amazon Personalize, consulta. Etichettare le risorse di Amazon Personalize

  9. Scegli Crea processo. Il processo viene avviato e viene visualizzata la pagina dei dettagli.

    Dopo aver creato un lavoro, è necessario circa un giorno per eliminare i dati degli utenti dai set di dati e dai modelli. Fino al completamento del processo, Amazon Personalize continua a utilizzare i dati durante la formazione. E gli utenti potrebbero apparire in segmenti di utenti.

    L'eliminazione dei dati è completa quando lo stato viene visualizzato comeCOMPLETED. Se il processo fallisce per qualsiasi motivo, ti consigliamo di creare un altro processo di eliminazione dei dati. Al termine di un processo, assicurati di aggiornare tutte le risorse personalizzate. Assicurati di creare una nuova versione della soluzione e, se necessario, di aggiornare la campagna. Se utilizzi la formazione automatica, puoi comunque creare manualmente nuove versioni della soluzione.

Per eliminare utenti con AWS CLI, usa il create-data-deletion-job comando. Questo comando utilizza l' CreateDataDeletion APIoperazione. Il codice seguente mostra come creare un processo di eliminazione dei dati. Per utilizzare il codice, aggiornalo per specificare il nome del lavoro, il IAM ruolo in Creare un IAM ruolo per Amazon Personalize cui hai creato e la posizione Amazon S3 dei tuoi dati. Hai preparato questo file inPreparazione di un elenco di utenti da eliminare.

aws personalize create-data-deletion-job \ --job-name deletion job name \ --dataset-group-arn dataset group ARN \ --data-source dataLocation=s3://amzn-s3-demo-bucket/filename.csv \ --role-arn roleArn

Dopo aver creato un lavoro, è necessario circa un giorno per eliminare i dati degli utenti da set di dati e modelli. Fino al completamento del processo, Amazon Personalize continua a utilizzare i dati durante la formazione. E gli utenti potrebbero apparire in segmenti di utenti.

Il lavoro è completo quando lo stato èCOMPLETED. Controllate lo stato utilizzando il describe-data-deletion-job comando e specificate il processo di eliminazione dei datiARN. Per ulteriori informazioni sull'APIoperazione, vedereDescribeDataDeletionJob. Per visualizzare una cronologia dei processi di eliminazione dei dati ordinati in base alla data di creazione, utilizzare l'ListDataDeletionJobsAPIoperazione.

Se il processo fallisce per qualsiasi motivo, ti consigliamo di creare un altro processo di eliminazione dei dati. Al termine di un processo, assicurati di aggiornare tutte le risorse personalizzate. Assicurati di creare una nuova versione della soluzione e, se necessario, di aggiornare la campagna. Se utilizzi la formazione automatica, puoi comunque creare manualmente nuove versioni della soluzione.

Per eliminare utenti con AWS SDKs, utilizzare l'CreateDataDeletionJobAPIoperazione. Il codice seguente mostra come creare un processo di eliminazione dei dati. Per utilizzare il codice, aggiornalo per specificare il nome del lavoro, il IAM ruolo in Creare un IAM ruolo per Amazon Personalize cui hai creato e la posizione Amazon S3 dei tuoi dati. Hai preparato questo file inPreparazione di un elenco di utenti da eliminare.

import boto3 personalize = boto3.client('personalize') response = personalize.create_data_deletion_job( jobName = 'Deletion job name', datasetGroupArn = 'Dataset Group ARN', dataSource = {'dataLocation':'s3://amzn-s3-demo-bucket/file.csv'}, roleArn = 'role_arn' ) deletion_job_arn = response['dataDeletionJobArn'] print ('Deletion Job arn: ' + deletion_job_arn) description = personalize.describe_data_deletion_job( dataDeletionJobArn = deletion_job_arn)['dataDeletionJob'] print('Name: ' + description['jobName']) print('ARN: ' + description['dataDeletionJobArn']) print('Status: ' + description['status'])

Dopo aver creato un lavoro, è necessario circa un giorno per eliminare i dati degli utenti da set di dati e modelli. Fino al completamento del processo, Amazon Personalize continua a utilizzare i dati durante la formazione. E gli utenti potrebbero apparire in segmenti di utenti.

Il lavoro è completo quando lo stato èCOMPLETED. Controllate lo stato utilizzando l'DescribeDataDeletionJoboperazione e specificate il processo di eliminazione dei datiARN. Per visualizzare una cronologia dei processi di eliminazione dei dati ordinati in base alla data di creazione, utilizzare l'ListDataDeletionJobsAPIoperazione.

Se il processo fallisce per qualsiasi motivo, ti consigliamo di creare un altro processo di eliminazione dei dati. Al termine di un processo, assicurati di aggiornare tutte le risorse personalizzate. Assicurati di creare una nuova versione della soluzione e, se necessario, di aggiornare la campagna. Se utilizzi la formazione automatica, puoi comunque creare manualmente nuove versioni della soluzione.