Eliminar usuarios y sus datos con un trabajo de eliminación de datos - Amazon Personalize

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Eliminar usuarios y sus datos con un trabajo de eliminación de datos

Tras importar los datos, puede eliminar los usuarios y sus datos, incluidos sus metadatos y datos de interacciones, de un grupo de conjuntos de datos. Puedes eliminar los datos de los usuarios como parte de un programa de cumplimiento, o para atender las solicitudes de eliminación de usuarios, o para mantener tus datos actualizados a medida que cambia tu base de usuarios.

Tras eliminar los usuarios, Amazon Personalize ya no utiliza sus datos y deja de tener en cuenta a los usuarios al generar segmentos de usuarios.

Para eliminar las referencias a los usuarios en los conjuntos de datos y modelos de Amazon Personalize de un grupo de conjuntos de datos, haga lo siguiente:

  1. Prepare un archivo CSV que enumere los ID de usuario de los usuarios que desee eliminar en una columna USER_ID.

  2. Cargue el archivo CSV en un bucket de Amazon S3. Su función de servicio Amazon Personalize debe tener permiso para acceder a este depósito.

  3. Cree un trabajo de eliminación de datos. Un trabajo de eliminación de datos es un trabajo por lotes que elimina los usuarios y sus datos de los modelos y conjuntos de datos de un grupo de conjuntos de datos.

Directrices y requisitos

A continuación se indican las directrices y los requisitos para eliminar usuarios:

  • Antes de crear un trabajo de eliminación de datos, asegúrese de que no haya ningún trabajo en curso que utilice sus conjuntos de datos, como trabajos de formación, trabajos por lotes u operaciones de importación masiva o individual. Y evite crear dichos trabajos mientras haya un trabajo de eliminación de datos en curso. Si se produce algún proceso de formación o importación, no podemos garantizar que los datos de los usuarios se eliminen de los modelos, por lo que recomendamos crear un trabajo de eliminación de datos adicional.

  • Un trabajo de eliminación de datos no elimina las referencias a usuarios ajenos a Amazon Personalize. Por ejemplo, no elimina su ID de usuario de las recomendaciones de lotes de tu bucket de Amazon S3. Debe eliminar estos registros manualmente.

  • Puede tener hasta 5 tareas de eliminación para un grupo de conjuntos de datos con el estado PENDIENTE.

  • El tamaño total máximo de los archivos de entrada para la eliminación de datos es de 50 MB. Puede reutilizar el mismo archivo de entrada al crear trabajos de eliminación.

  • Cada trabajo de eliminación de datos elimina los usuarios y sus datos de interacción en un grupo de conjuntos de datos. Para eliminar sus datos en todos los grupos de conjuntos de datos, debe crear un trabajo de eliminación de datos para cada grupo de conjuntos de datos.

  • Después de crear un trabajo, eliminar los datos de los usuarios de los conjuntos de datos y modelos puede tardar hasta un día.

  • Una vez finalizado un trabajo, asegúrate de actualizar todos los recursos personalizados. Asegúrese de crear una nueva versión de la solución y, si es necesario, de actualizar la campaña. Si utilizas la formación automática, puedes crear nuevas versiones de la solución de forma manual.

  • Su rol de servicio Amazon Personalize debe tener permiso para acceder a su bucket de Amazon S3 con la lista de usuarios que desea eliminar. Necesita GetObject ListBucket permisos para el bucket y su contenido. Estos permisos son los mismos que los de importación de datos. Para obtener información sobre la concesión de permisos y ejemplos de políticas, consulteConcesión de acceso a Amazon Personalize para los recursos de Amazon S3.

  • No puede usar su propia AWS Key Management Service clave en el depósito de Amazon S3 que almacena la lista de ID de usuario de los usuarios que desea eliminar.

  • Si un elemento aparece solo en el conjunto de datos de tu conjunto de datos de interacciones entre elementos y solo los usuarios que vas a eliminar interactuaron con él, este elemento dejará de aparecer en las recomendaciones.

Preparar una lista de usuarios para eliminarlos

Antes de eliminar usuarios de Amazon Personalize, debe preparar una lista de usuarios para eliminarlos en un archivo CSV y subirla a Amazon S3.

Para preparar la lista de usuarios para eliminarla y subirla
  1. Cree un archivo CSV en el que figuren los ID de usuario de los usuarios que desee eliminar. A continuación, se muestra cómo debe formatearse el archivo CSV.

    USER_ID abc 2a 5basc ab35 123f a55d 0v22 441fa efg
  2. Sube tu archivo CSV a un bucket de Amazon Simple Storage Service (Amazon S3). Para obtener más información sobre la carga de archivos a Amazon S3, consulte Carga de archivos y carpetas mediante la función de arrastrar y soltar en la Guía del usuario de Amazon Simple Storage Service.

  3. Concede a Amazon Personalize acceso a tu depósito y a tu archivo CSV. Amazon Personalize debe tener permiso para realizar las ListBucket acciones GetObject y en tu bucket y su contenido. Estos permisos son los mismos que los de importación de datos. Para obtener información sobre la concesión de permisos y ejemplos de políticas, consulteConcesión de acceso a Amazon Personalize para los recursos de Amazon S3.

Crear un trabajo de eliminación de datos

Una vez completadoPreparar una lista de usuarios para eliminarlos, estará listo para eliminar los usuarios con un trabajo de eliminación de datos.

Un trabajo de eliminación de datos es un trabajo por lotes que elimina los usuarios y sus datos de los modelos y conjuntos de datos de un grupo de conjuntos de datos. Tras eliminar los usuarios, Amazon Personalize ya no utiliza sus datos y deja de tener en cuenta a los usuarios al generar segmentos de usuarios.

Al crear un trabajo de eliminación de datos, debe especificar la ubicación en Amazon S3 de la lista de usuarios que desea eliminar.

  • Si los datos están en un solo archivo, utilice la siguiente sintaxis para la ubicación de Amazon S3:

    s3://<name of your S3 bucket>/<folder path>/<CSV filename>.csv

  • Si sus archivos CSV se encuentran en una carpeta de su bucket de Amazon S3, puede especificar la ruta a la carpeta. Cuando se trata de una tarea de eliminación de datos, Amazon Personalize utiliza todos los archivos con la extensión de .csv archivo de la carpeta y de cualquier subcarpeta. Ignora los archivos de cualquier otro tipo. Use la siguiente sintaxis con una / después del nombre de la carpeta:

    s3://<name of your S3 bucket>/<folder path>/

El rol que utilices debe tener permiso para realizar las ListBucket acciones GetObject y en tu bucket de Amazon S3 y su contenido. Para obtener información sobre la concesión de permisos y ejemplos de políticas, consulteConcesión de acceso a Amazon Personalize para los recursos de Amazon S3.

Puede crear un trabajo de eliminación de datos con la consola Amazon Personalize, el AWS Command Line Interface (AWS CLI) o AWS los SDK.

Para eliminar usuarios con la consola Amazon Personalize, cree un trabajo de eliminación de datos con un nombre, la función de servicio de IAM y la ubicación de sus datos en Amazon S3.

Para eliminar registros (consola)
  1. Abra la consola de Amazon Personalize en https://console.aws.amazon.com/personalize/home e inicie sesión en su cuenta.

  2. En la página Grupos de conjuntos de datos, elija su grupo de conjuntos de datos. Aparece la Información general del grupo de conjuntos de datos.

  3. En el panel de navegación de la izquierda, elija Conjuntos de datos.

  4. En Trabajos de eliminación de datos, elija Crear trabajo.

  5. En Detalles del trabajo, asigne un nombre al trabajo.

  6. En S3 Input source, para S3 Location, especifique la ubicación en Amazon S3 del archivo CSV que almacena la lista de ID de usuario de los usuarios que se van a eliminar. Preparó este archivo en. Preparar una lista de usuarios para eliminarlos

  7. En Rol de IAM, elija crear un rol nuevo o usar uno existente. Si ha completado los requisitos previos para crear un rol para Amazon Personalize y ha concedido a este rol acceso a su bucket de Amazon S3, elija Usar un rol de servicio existente y especifique el rol en Creación de un rol de IAM para Amazon Personalize el que lo creó.

    El rol que utilices debe tener permiso para realizar las ListBucket acciones GetObject y en tu bucket de Amazon S3 y su contenido. Estos permisos son los mismos que los de importación de datos. Para obtener información sobre la concesión de permisos y ejemplos de políticas, consulteConcesión de acceso a Amazon Personalize para los recursos de Amazon S3.

  8. Para Etiquetas, si lo desea, añada cualquier etiqueta. Para obtener más información acerca del etiquetado de recursos de Amazon Personalize, consulte Etiquetado de recursos de Amazon Personalize.

  9. Seleccione Crear trabajo. El trabajo comienza y aparece la página de detalles.

    Tras crear un trabajo, se tarda aproximadamente un día en eliminar los datos de los usuarios de los conjuntos de datos y modelos. Hasta que se complete el trabajo, Amazon Personalize seguirá utilizando los datos durante el entrenamiento. Además, los usuarios pueden aparecer en segmentos de usuarios.

    La eliminación de datos se completa cuando el estado se muestra como COMPLETADO. Si el trabajo falla por algún motivo, recomendamos crear otro trabajo de eliminación de datos. Cuando se complete un trabajo, asegúrese de actualizar todos los recursos personalizados. Asegúrese de crear una nueva versión de la solución y, si es necesario, de actualizar la campaña. Si utilizas la formación automática, puedes crear nuevas versiones de la solución de forma manual.

Para eliminar usuarios con el AWS CLI, utilice el create-data-deletion-job comando. Este comando usa la operación CreateDataDeletion API. El código siguiente muestra cómo crear un trabajo de eliminación de datos. Para usar el código, actualícelo para especificar el nombre del trabajo, el rol de IAM en Creación de un rol de IAM para Amazon Personalize el que creó y la ubicación de sus datos en Amazon S3. Preparó este archivo enPreparar una lista de usuarios para eliminarlos.

aws personalize create-data-deletion-job \ --job-name deletion job name \ --dataset-group-arn dataset group ARN \ --data-source dataLocation=s3://bucketname/filename.csv \ --role-arn roleArn

Después de crear un trabajo, puede tardar aproximadamente un día en eliminar los datos de los usuarios de los conjuntos de datos y modelos. Hasta que se complete el trabajo, Amazon Personalize seguirá utilizando los datos durante el entrenamiento. Además, los usuarios pueden aparecer en segmentos de usuarios.

El trabajo está completo cuando el estado es COMPLETADO. Compruebe el estado mediante el describe-data-deletion-job comando y especifique el ARN del trabajo de eliminación de datos. Para obtener más información sobre el funcionamiento de la API, consulteDescribeDataDeletionJob. Para ver un historial de los trabajos de eliminación de datos ordenados por hora de creación, utilice la operación de ListDataDeletionJobs API.

Si el trabajo falla por algún motivo, recomendamos crear otro trabajo de eliminación de datos. Cuando se complete un trabajo, asegúrese de actualizar todos los recursos personalizados. Asegúrese de crear una nueva versión de la solución y, si es necesario, de actualizar la campaña. Si utilizas la formación automática, puedes crear nuevas versiones de la solución de forma manual.

Para eliminar usuarios con los AWS SDK, utilice la operación CreateDataDeletionJob API. El código siguiente muestra cómo crear un trabajo de eliminación de datos. Para usar el código, actualícelo para especificar el nombre del trabajo, el rol de IAM en Creación de un rol de IAM para Amazon Personalize el que creó y la ubicación de sus datos en Amazon S3. Preparó este archivo enPreparar una lista de usuarios para eliminarlos.

import boto3 personalize = boto3.client('personalize') response = personalize.create_data_deletion_job( jobName = 'Deletion job name', datasetGroupArn = 'Dataset Group ARN', dataSource = {'dataLocation':'s3://bucket/file.csv'}, roleArn = 'role_arn' ) deletion_job_arn = response['dataDeletionJobArn'] print ('Deletion Job arn: ' + deletion_job_arn) description = personalize.describe_data_deletion_job( dataDeletionJobArn = deletion_job_arn)['dataDeletionJob'] print('Name: ' + description['jobName']) print('ARN: ' + description['dataDeletionJobArn']) print('Status: ' + description['status'])

Después de crear un trabajo, puede tardar aproximadamente un día en eliminar los datos de los usuarios de los conjuntos de datos y modelos. Hasta que se complete el trabajo, Amazon Personalize seguirá utilizando los datos durante el entrenamiento. Además, los usuarios pueden aparecer en segmentos de usuarios.

El trabajo está completo cuando el estado es COMPLETADO. Compruebe el estado mediante la DescribeDataDeletionJob operación y especifique el ARN del trabajo de eliminación de datos. Para ver un historial de los trabajos de eliminación de datos ordenados por hora de creación, utilice la operación de ListDataDeletionJobs API.

Si el trabajo falla por algún motivo, recomendamos crear otro trabajo de eliminación de datos. Cuando se complete un trabajo, asegúrese de actualizar todos los recursos personalizados. Asegúrese de crear una nueva versión de la solución y, si es necesario, de actualizar la campaña. Si utilizas la formación automática, puedes crear nuevas versiones de la solución de forma manual.