Eliminazione degli utenti e dei relativi dati con un processo di eliminazione dei dati - Amazon Personalize

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Eliminazione degli utenti e dei relativi dati con un processo di eliminazione dei dati

Dopo aver importato i dati, puoi eliminare gli utenti e i relativi dati, inclusi i metadati e i dati di interazione, da un gruppo di set di dati. È possibile eliminare i dati degli utenti come parte di un programma di conformità, per soddisfare le richieste di eliminazione degli utenti o per mantenere i dati aggiornati man mano che la base utenti cambia.

Dopo aver eliminato gli utenti, Amazon Personalize non si basa più sui loro dati e non li considera più durante la generazione di segmenti di utenti.

Per eliminare i riferimenti agli utenti nei set di dati e nei modelli di Amazon Personalize in un gruppo di set di dati, procedi come segue:

  1. Prepara un file CSV che elenchi gli ID utente degli utenti da eliminare in una colonna USER_ID.

  2. Carica il file CSV in un bucket Amazon S3. Il tuo ruolo di servizio Amazon Personalize deve avere l'autorizzazione per accedere a questo bucket.

  3. Crea un processo di eliminazione dei dati. Un processo di eliminazione dei dati è un processo in batch che elimina gli utenti e i relativi dati dai modelli e dai set di dati in un gruppo di set di dati.

Linee guida e requisiti

Di seguito sono riportate le linee guida e i requisiti per l'eliminazione degli utenti:

  • Prima di creare un processo di eliminazione dei dati, assicurati che non sia in corso alcun processo che utilizza i tuoi set di dati, ad esempio lavori di formazione, lavori in batch o operazioni di importazione collettive o individuali. Inoltre, evita di creare tali lavori mentre è in corso un processo di eliminazione dei dati. In caso di formazione o importazione, non possiamo garantire che i dati degli utenti vengano eliminati dai modelli e consigliamo di creare un processo di eliminazione dei dati aggiuntivo.

  • Un processo di eliminazione dei dati non elimina i riferimenti a utenti esterni ad Amazon Personalize. Ad esempio, non elimina il relativo UserID dai consigli sui batch nel bucket Amazon S3. È necessario eliminare manualmente questi record.

  • È possibile avere fino a 5 processi di eliminazione per un gruppo di set di dati con lo stato IN SOSPESO.

  • La dimensione totale massima del file o dei file di input per l'eliminazione dei dati è di 50 MB. È possibile riutilizzare lo stesso file di input durante la creazione dei processi di eliminazione.

  • Ogni processo di eliminazione dei dati elimina gli utenti e i relativi dati di interazione in un gruppo di set di dati. Per eliminare i loro dati in tutti i gruppi di set di dati, è necessario creare un processo di eliminazione dei dati per ogni gruppo di set di dati.

  • Dopo aver creato un processo, l'eliminazione dei dati degli utenti da set di dati e modelli può richiedere fino a un giorno.

  • Al termine di un processo, assicurati di aggiornare tutte le risorse personalizzate. Assicurati di creare una nuova versione della soluzione e, se necessario, di aggiornare la campagna. Se utilizzi la formazione automatica, puoi comunque creare manualmente nuove versioni della soluzione.

  • Il tuo ruolo di servizio Amazon Personalize deve avere l'autorizzazione ad accedere al tuo bucket Amazon S3 con l'elenco di utenti da eliminare. Ha bisogno di autorizzazioni GetObject e ListBucket autorizzazioni per il bucket e il suo contenuto. Queste autorizzazioni sono le stesse dell'importazione dei dati. Per informazioni sulla concessione di autorizzazioni ed esempi di policy, consulta. Offrire ad Amazon Personalize l'accesso alle risorse di Amazon S3

  • Non puoi usare la tua AWS Key Management Service chiave nel bucket Amazon S3 che memorizza l'elenco di ID utente degli utenti da eliminare.

  • Se un elemento appare solo nel set di dati sulle interazioni tra oggetti e solo gli utenti che stai eliminando hanno interagito con questo elemento, questo elemento non verrà più visualizzato nei consigli.

Preparazione di un elenco di utenti da eliminare

Prima di eliminare utenti da Amazon Personalize, devi preparare un elenco di utenti da eliminare in un file CSV e caricarlo su Amazon S3.

Per preparare l'elenco di utenti da eliminare e caricare
  1. Crea un file CSV che elenchi gli ID utente degli utenti da eliminare. Di seguito viene illustrato come deve essere formattato il file CSV.

    USER_ID abc 2a 5basc ab35 123f a55d 0v22 441fa efg
  2. Carica il tuo file CSV in un bucket Amazon Simple Storage Service (Amazon S3). Per ulteriori informazioni sul caricamento di file su Amazon S3, consulta Caricamento di file e cartelle tramite Drag and Drop nella Guida per l'utente di Amazon Simple Storage Service.

  3. Consenti ad Amazon Personalize di accedere al tuo bucket e al tuo file CSV. Amazon Personalize deve essere autorizzato a eseguire ListBucket le azioni GetObject and sul bucket e sul suo contenuto. Queste autorizzazioni sono le stesse dell'importazione di dati. Per informazioni sulla concessione di autorizzazioni ed esempi di policy, consulta. Offrire ad Amazon Personalize l'accesso alle risorse di Amazon S3

Creazione di un processo di eliminazione dei dati

Al terminePreparazione di un elenco di utenti da eliminare, sei pronto per eliminare gli utenti con un processo di eliminazione dei dati.

Un processo di eliminazione dei dati è un processo in batch che elimina gli utenti e i relativi dati dai modelli e dai set di dati in un gruppo di set di dati. Dopo aver eliminato gli utenti, Amazon Personalize non si basa più sui loro dati e non li considera più durante la generazione di segmenti di utenti.

Quando crei un processo di eliminazione dei dati, specifichi la posizione Amazon S3 dell'elenco di utenti da eliminare.

  • Se i dati sono in un unico file, utilizza la seguente sintassi per la posizione Amazon S3:

    s3://<name of your S3 bucket>/<folder path>/<CSV filename>.csv

  • Se i tuoi file CSV si trovano in una cartella del tuo bucket Amazon S3, puoi specificare il percorso della cartella. Con un processo di eliminazione dei dati, Amazon Personalize utilizza tutti i file con estensione nella cartella e in qualsiasi sottocartella. .csv Ignora i file di qualsiasi altro tipo. Utilizzate la seguente sintassi con una / dopo il nome della cartella:

    s3://<name of your S3 bucket>/<folder path>/

Il ruolo che utilizzi deve avere l'autorizzazione per eseguire le ListBucket azioni GetObject and sul tuo bucket Amazon S3 e sul suo contenuto. Per informazioni sulla concessione di autorizzazioni ed esempi di policy, consulta. Offrire ad Amazon Personalize l'accesso alle risorse di Amazon S3

Puoi creare un processo di eliminazione dei dati con la console Amazon Personalize, AWS Command Line Interface (AWS CLI) o AWS gli SDK.

Per eliminare utenti con la console Amazon Personalize, crea un processo di eliminazione dei dati con un nome, il ruolo del servizio IAM e la posizione Amazon S3 dei tuoi dati.

Per eliminare i record (console)
  1. Apri la console Amazon Personalize all'indirizzo https://console.aws.amazon.com/personalize/home e accedi al tuo account.

  2. Nella pagina dei gruppi di set di dati, scegli il tuo gruppo di set di dati. Viene visualizzata la panoramica del gruppo di set di dati.

  3. Nel riquadro di navigazione, scegli Set di dati.

  4. In Processi di eliminazione dei dati, scegli Crea lavoro.

  5. In Dettagli del lavoro, assegna un nome al lavoro.

  6. In S3 Input source, per S3 Location, specifica la posizione Amazon S3 del file CSV che memorizza l'elenco degli ID utente degli utenti da eliminare. Hai preparato questo file in. Preparazione di un elenco di utenti da eliminare

  7. Nel ruolo IAM, scegli di creare un nuovo ruolo o di utilizzarne uno esistente. Se hai completato i prerequisiti per creare un ruolo per Amazon Personalize e hai concesso a questo ruolo l'accesso al tuo bucket Amazon S3, scegli Usa un ruolo di servizio esistente e specifica il ruolo in cui hai creato. Creazione di un ruolo IAM per Amazon Personalize

    Il ruolo che utilizzi deve avere l'autorizzazione per eseguire le ListBucket azioni GetObject and sul tuo bucket Amazon S3 e sul suo contenuto. Queste autorizzazioni sono le stesse dell'importazione di dati. Per informazioni sulla concessione di autorizzazioni ed esempi di policy, consulta. Offrire ad Amazon Personalize l'accesso alle risorse di Amazon S3

  8. Per i tag, aggiungi facoltativamente qualsiasi tag. Per ulteriori informazioni sull'etichettatura delle risorse Amazon Personalize, consulta. Etichettare le risorse di Amazon Personalize

  9. Scegli Crea processo. Il processo viene avviato e viene visualizzata la pagina dei dettagli.

    Dopo aver creato un lavoro, è necessario circa un giorno per eliminare i dati degli utenti dai set di dati e dai modelli. Fino al completamento del processo, Amazon Personalize continua a utilizzare i dati durante la formazione. E gli utenti potrebbero apparire in segmenti di utenti.

    L'eliminazione dei dati è completa quando lo stato viene visualizzato come COMPLETATO. Se il processo fallisce per qualsiasi motivo, ti consigliamo di creare un altro processo di eliminazione dei dati. Al termine di un processo, assicurati di aggiornare tutte le risorse personalizzate. Assicurati di creare una nuova versione della soluzione e, se necessario, di aggiornare la campagna. Se utilizzi la formazione automatica, puoi comunque creare manualmente nuove versioni della soluzione.

Per eliminare utenti con AWS CLI, usa il create-data-deletion-job comando. Questo comando utilizza l'operazione CreateDataDeletion API. Il codice seguente mostra come creare un processo di eliminazione dei dati. Per utilizzare il codice, aggiornalo per specificare il nome del job, il ruolo IAM in Creazione di un ruolo IAM per Amazon Personalize cui hai creato e la posizione Amazon S3 dei tuoi dati. Hai preparato questo file inPreparazione di un elenco di utenti da eliminare.

aws personalize create-data-deletion-job \ --job-name deletion job name \ --dataset-group-arn dataset group ARN \ --data-source dataLocation=s3://bucketname/filename.csv \ --role-arn roleArn

Dopo aver creato un lavoro, è necessario circa un giorno per eliminare i dati degli utenti da set di dati e modelli. Fino al completamento del processo, Amazon Personalize continua a utilizzare i dati durante la formazione. E gli utenti potrebbero apparire in segmenti di utenti.

Il lavoro è completo quando lo stato è COMPLETATO. Controllate lo stato utilizzando il describe-data-deletion-job comando e specificate l'ARN del job di eliminazione dei dati. Per ulteriori informazioni sul funzionamento dell'API, vedereDescribeDataDeletionJob. Per visualizzare una cronologia dei processi di eliminazione dei dati ordinati per ora di creazione, utilizza l'operazione ListDataDeletionJobs API.

Se il processo fallisce per qualsiasi motivo, ti consigliamo di creare un altro processo di eliminazione dei dati. Al termine di un processo, assicurati di aggiornare tutte le risorse personalizzate. Assicurati di creare una nuova versione della soluzione e, se necessario, di aggiornare la campagna. Se utilizzi la formazione automatica, puoi comunque creare manualmente nuove versioni della soluzione.

Per eliminare gli utenti con gli AWS SDK, utilizza l'operazione CreateDataDeletionJob API. Il codice seguente mostra come creare un processo di eliminazione dei dati. Per utilizzare il codice, aggiornalo per specificare il nome del job, il ruolo IAM in Creazione di un ruolo IAM per Amazon Personalize cui hai creato e la posizione Amazon S3 dei tuoi dati. Hai preparato questo file inPreparazione di un elenco di utenti da eliminare.

import boto3 personalize = boto3.client('personalize') response = personalize.create_data_deletion_job( jobName = 'Deletion job name', datasetGroupArn = 'Dataset Group ARN', dataSource = {'dataLocation':'s3://bucket/file.csv'}, roleArn = 'role_arn' ) deletion_job_arn = response['dataDeletionJobArn'] print ('Deletion Job arn: ' + deletion_job_arn) description = personalize.describe_data_deletion_job( dataDeletionJobArn = deletion_job_arn)['dataDeletionJob'] print('Name: ' + description['jobName']) print('ARN: ' + description['dataDeletionJobArn']) print('Status: ' + description['status'])

Dopo aver creato un lavoro, è necessario circa un giorno per eliminare i dati degli utenti da set di dati e modelli. Fino al completamento del processo, Amazon Personalize continua a utilizzare i dati durante la formazione. E gli utenti potrebbero apparire in segmenti di utenti.

Il lavoro è completo quando lo stato è COMPLETATO. Controllate lo stato utilizzando l'DescribeDataDeletionJoboperazione e specificate l'ARN del processo di eliminazione dei dati. Per visualizzare una cronologia dei processi di eliminazione dei dati ordinati per ora di creazione, utilizza l'operazione ListDataDeletionJobs API.

Se il processo fallisce per qualsiasi motivo, ti consigliamo di creare un altro processo di eliminazione dei dati. Al termine di un processo, assicurati di aggiornare tutte le risorse personalizzate. Assicurati di creare una nuova versione della soluzione e, se necessario, di aggiornare la campagna. Se utilizzi la formazione automatica, puoi comunque creare manualmente nuove versioni della soluzione.