Supprimer des utilisateurs et leurs données à l'aide d'une tâche de suppression de données - Amazon Personalize

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Supprimer des utilisateurs et leurs données à l'aide d'une tâche de suppression de données

Après avoir importé des données, vous pouvez supprimer les utilisateurs et leurs données, y compris leurs métadonnées et leurs données d'interaction, d'un groupe de jeux de données. Vous pouvez supprimer des données utilisateur dans le cadre d'un programme de conformité, ou pour répondre aux demandes de suppression d'utilisateurs, ou pour maintenir vos données à jour en fonction de l'évolution de votre base d'utilisateurs.

Une fois que vous avez supprimé des utilisateurs, Amazon Personalize ne s'entraîne plus sur leurs données et ne prend plus en compte les utilisateurs lors de la génération de segments d'utilisateurs.

Pour supprimer les références aux utilisateurs dans les ensembles de données Amazon Personalize et les modèles d'un groupe de jeux de données, procédez comme suit :

  1. Préparez un fichier CSV répertoriant les UserID des utilisateurs à supprimer dans une colonne USER_ID.

  2. Téléchargez le fichier CSV dans un compartiment Amazon S3. Votre rôle de service Amazon Personalize doit être autorisé à accéder à ce compartiment.

  3. Créez une tâche de suppression de données. Une tâche de suppression de données est une tâche par lots qui supprime les utilisateurs et leurs données des modèles et des ensembles de données d'un groupe de jeux de données.

Directives et exigences

Les instructions et les exigences relatives à la suppression d'utilisateurs sont les suivantes :

  • Avant de créer une tâche de suppression de données, assurez-vous qu'aucune tâche utilisant vos ensembles de données n'est en cours, comme les tâches de formation, les tâches par lots ou les opérations d'importation groupées ou individuelles. Et évitez de créer de tels emplois pendant qu'une tâche de suppression de données est en cours. En cas de formation ou d'importation, nous ne pouvons pas garantir que les données des utilisateurs seront supprimées des modèles et nous vous recommandons de créer une tâche de suppression de données supplémentaire.

  • Une tâche de suppression de données ne supprime pas les références à des utilisateurs extérieurs à Amazon Personalize. Par exemple, il ne supprime pas leur UserID des recommandations par lots dans votre compartiment Amazon S3. Vous devez supprimer ces enregistrements manuellement.

  • Vous pouvez avoir jusqu'à 5 tâches de suppression pour un groupe de jeux de données dont le statut est EN ATTENTE.

  • La taille totale maximale de votre ou de vos fichiers d'entrée de suppression de données est de 50 Mo. Vous pouvez réutiliser le même fichier d'entrée lorsque vous créez des tâches de suppression.

  • Chaque tâche de suppression de données supprime les utilisateurs et leurs données d'interaction dans un groupe de jeux de données. Pour supprimer leurs données dans tous les groupes de jeux de données, vous devez créer une tâche de suppression de données pour chaque groupe de jeux de données.

  • Une fois que vous avez créé une tâche, la suppression des données des utilisateurs des ensembles de données et des modèles peut prendre jusqu'à un jour.

  • Une fois la tâche terminée, veillez à mettre à jour les ressources personnalisées. Assurez-vous de créer une nouvelle version de la solution et, si nécessaire, de mettre à jour votre campagne. Si vous utilisez l'entraînement automatique, vous pouvez toujours créer manuellement de nouvelles versions de solution.

  • Votre rôle de service Amazon Personalize doit être autorisé à accéder à votre compartiment Amazon S3 contenant la liste des utilisateurs à supprimer. Il a besoin GetObject d'ListBucketautorisations et d'autorisations pour le bucket et son contenu. Ces autorisations sont identiques à celles relatives à l'importation de données. Pour plus d'informations sur l'octroi d'autorisations et des exemples de politiques, consultezPermettre à Amazon Personalize d'accéder aux ressources Amazon S3.

  • Vous ne pouvez pas utiliser votre propre AWS Key Management Service clé dans le compartiment Amazon S3 qui stocke la liste des UserID des utilisateurs à supprimer.

  • Si un élément apparaît uniquement dans votre jeu de données d'interactions entre articles et que seuls les utilisateurs que vous supprimez ont interagi avec cet élément, cet élément n'apparaîtra plus dans les recommandations.

Préparation d'une liste d'utilisateurs à supprimer

Avant de supprimer des utilisateurs d'Amazon Personalize, vous devez préparer une liste d'utilisateurs à supprimer dans un fichier CSV et la télécharger sur Amazon S3.

Pour préparer la liste des utilisateurs à supprimer et à télécharger
  1. Créez un fichier CSV répertoriant les identifiants des utilisateurs à supprimer. Ce qui suit montre comment votre fichier CSV doit être formaté.

    USER_ID abc 2a 5basc ab35 123f a55d 0v22 441fa efg
  2. Chargez votre fichier CSV dans un compartiment Amazon Simple Storage Service (Amazon S3). Pour plus d'informations sur le chargement de fichiers vers Amazon S3, consultez la section Chargement de fichiers et de dossiers par glisser-déposer dans le guide de l'utilisateur d'Amazon Simple Storage Service.

  3. Donnez à Amazon Personalize l'accès à votre bucket et à votre fichier CSV. Amazon Personalize doit être autorisé à exécuter les ListBucket actions GetObject et sur votre compartiment et son contenu. Ces autorisations sont identiques à celles relatives à l'importation de données. Pour plus d'informations sur l'octroi d'autorisations et des exemples de politiques, consultezPermettre à Amazon Personalize d'accéder aux ressources Amazon S3.

Création d'une tâche de suppression de données

Une fois que vous avez terminéPréparation d'une liste d'utilisateurs à supprimer, vous êtes prêt à supprimer les utilisateurs à l'aide d'une tâche de suppression de données.

Une tâche de suppression de données est une tâche par lots qui supprime les utilisateurs et leurs données des modèles et des ensembles de données d'un groupe de jeux de données. Une fois que vous avez supprimé des utilisateurs, Amazon Personalize ne s'entraîne plus sur leurs données et ne prend plus en compte les utilisateurs lors de la génération de segments d'utilisateurs.

Lorsque vous créez une tâche de suppression de données, vous spécifiez l'emplacement Amazon S3 de votre liste d'utilisateurs à supprimer.

  • Si vos données se trouvent dans un seul fichier, utilisez la syntaxe suivante pour l'emplacement Amazon S3 :

    s3://<name of your S3 bucket>/<folder path>/<CSV filename>.csv

  • Si vos fichiers CSV se trouvent dans un dossier de votre compartiment Amazon S3, vous pouvez spécifier le chemin d'accès au dossier. Dans le cadre d'une tâche de suppression de données, Amazon Personalize utilise tous les fichiers portant l'extension de .csv fichier dans le dossier et dans n'importe quel sous-dossier. Il ignore les fichiers de tout autre type. Utilisez la syntaxe suivante avec un / après le nom du dossier :

    s3://<name of your S3 bucket>/<folder path>/

Le rôle que vous utilisez doit être autorisé à exécuter les ListBucket actions GetObject et sur votre compartiment Amazon S3 et son contenu. Pour plus d'informations sur l'octroi d'autorisations et des exemples de politiques, consultezPermettre à Amazon Personalize d'accéder aux ressources Amazon S3.

Vous pouvez créer une tâche de suppression de données à l'aide de la console Amazon Personalize, du AWS Command Line Interface (AWS CLI) ou AWS des SDK.

Pour supprimer des utilisateurs à l'aide de la console Amazon Personalize, créez une tâche de suppression de données avec un nom, le rôle de service IAM et l'emplacement Amazon S3 de vos données.

Pour supprimer des enregistrements (console)
  1. Ouvrez la console Amazon Personalize à l'adresse https://console.aws.amazon.com/personalize/home et connectez-vous à votre compte.

  2. Sur la page Groupes de jeux de données, choisissez votre groupe de jeux de données. La vue d'ensemble du groupe de jeux de données s'affiche.

  3. Dans le volet de navigation, sélectionnez Datasets.

  4. Dans Tâches de suppression de données, choisissez Créer une tâche.

  5. Dans Détails du job, nommez le job.

  6. Dans la source d'entrée S3, pour S3 Location, spécifiez l'emplacement Amazon S3 du fichier CSV qui stocke la liste des identifiants utilisateur des utilisateurs à supprimer. Vous avez préparé ce fichier enPréparation d'une liste d'utilisateurs à supprimer.

  7. Dans le rôle IAM, choisissez de créer un nouveau rôle ou d'utiliser un rôle existant. Si vous avez rempli les conditions requises pour créer un rôle pour Amazon Personalize et que vous avez accordé à ce rôle l'accès à votre compartiment Amazon S3, choisissez Utiliser un rôle de service existant et spécifiez le rôle dans Création d'un rôle IAM pour Amazon Personalize lequel vous l'avez créé.

    Le rôle que vous utilisez doit être autorisé à exécuter les ListBucket actions GetObject et sur votre compartiment Amazon S3 et son contenu. Ces autorisations sont identiques à celles relatives à l'importation de données. Pour plus d'informations sur l'octroi d'autorisations et des exemples de politiques, consultezPermettre à Amazon Personalize d'accéder aux ressources Amazon S3.

  8. Pour les balises, ajoutez éventuellement des balises. Pour plus d'informations sur le balisage des ressources Amazon Personalize, consultezMarquer les ressources Amazon Personalize.

  9. Choisissez Créer une tâche. La tâche démarre et la page de détails s'affiche.

    Après avoir créé une tâche, il faut environ une journée pour supprimer les données des utilisateurs des ensembles de données et des modèles. Jusqu'à ce que le travail soit terminé, Amazon Personalize continue d'utiliser les données lors de la formation. Et les utilisateurs peuvent apparaître dans des segments d'utilisateurs.

    La suppression des données est terminée lorsque le statut indique TERMINÉ. Si la tâche échoue pour une raison quelconque, nous vous recommandons de créer une autre tâche de suppression de données. Une fois la tâche terminée, veillez à mettre à jour les ressources personnalisées. Assurez-vous de créer une nouvelle version de la solution et, si nécessaire, de mettre à jour votre campagne. Si vous utilisez l'entraînement automatique, vous pouvez toujours créer manuellement de nouvelles versions de solution.

Pour supprimer des utilisateurs avec le AWS CLI, utilisez la create-data-deletion-job commande. Cette commande utilise l'opération CreateDataDeletion API. Le code suivant montre comment créer une tâche de suppression de données. Pour utiliser le code, mettez-le à jour pour spécifier le nom de la tâche, le rôle IAM dans Création d'un rôle IAM pour Amazon Personalize lequel vous l'avez créé et l'emplacement de vos données sur Amazon S3. Vous avez préparé ce fichier enPréparation d'une liste d'utilisateurs à supprimer.

aws personalize create-data-deletion-job \ --job-name deletion job name \ --dataset-group-arn dataset group ARN \ --data-source dataLocation=s3://bucketname/filename.csv \ --role-arn roleArn

Après avoir créé une tâche, il faut environ une journée pour supprimer les données des utilisateurs des ensembles de données et des modèles. Jusqu'à ce que le travail soit terminé, Amazon Personalize continue d'utiliser les données lors de la formation. Et les utilisateurs peuvent apparaître dans des segments d'utilisateurs.

La tâche est terminée lorsque le statut est TERMINÉ. Vérifiez l'état à l'aide de la describe-data-deletion-job commande et spécifiez l'ARN de la tâche de suppression des données. Pour plus d'informations sur le fonctionnement de l'API, consultezDescribeDataDeletionJob. Pour consulter l'historique des tâches de suppression de données triées par date de création, utilisez l'opération ListDataDeletionJobs API.

Si la tâche échoue pour une raison quelconque, nous vous recommandons de créer une autre tâche de suppression de données. Une fois la tâche terminée, veillez à mettre à jour les ressources personnalisées. Assurez-vous de créer une nouvelle version de la solution et, si nécessaire, de mettre à jour votre campagne. Si vous utilisez l'entraînement automatique, vous pouvez toujours créer manuellement de nouvelles versions de solution.

Pour supprimer des utilisateurs à l'aide AWS des SDK, utilisez l'opération CreateDataDeletionJob API. Le code suivant montre comment créer une tâche de suppression de données. Pour utiliser le code, mettez-le à jour pour spécifier le nom de la tâche, le rôle IAM dans Création d'un rôle IAM pour Amazon Personalize lequel vous l'avez créé et l'emplacement de vos données sur Amazon S3. Vous avez préparé ce fichier enPréparation d'une liste d'utilisateurs à supprimer.

import boto3 personalize = boto3.client('personalize') response = personalize.create_data_deletion_job( jobName = 'Deletion job name', datasetGroupArn = 'Dataset Group ARN', dataSource = {'dataLocation':'s3://bucket/file.csv'}, roleArn = 'role_arn' ) deletion_job_arn = response['dataDeletionJobArn'] print ('Deletion Job arn: ' + deletion_job_arn) description = personalize.describe_data_deletion_job( dataDeletionJobArn = deletion_job_arn)['dataDeletionJob'] print('Name: ' + description['jobName']) print('ARN: ' + description['dataDeletionJobArn']) print('Status: ' + description['status'])

Après avoir créé une tâche, il faut environ une journée pour supprimer les données des utilisateurs des ensembles de données et des modèles. Jusqu'à ce que le travail soit terminé, Amazon Personalize continue d'utiliser les données lors de la formation. Et les utilisateurs peuvent apparaître dans des segments d'utilisateurs.

La tâche est terminée lorsque le statut est TERMINÉ. Vérifiez l'état à l'aide de l'DescribeDataDeletionJobopération et spécifiez l'ARN de la tâche de suppression des données. Pour consulter l'historique des tâches de suppression de données triées par date de création, utilisez l'opération ListDataDeletionJobs API.

Si la tâche échoue pour une raison quelconque, nous vous recommandons de créer une autre tâche de suppression de données. Une fois la tâche terminée, veillez à mettre à jour les ressources personnalisées. Assurez-vous de créer une nouvelle version de la solution et, si nécessaire, de mettre à jour votre campagne. Si vous utilisez l'entraînement automatique, vous pouvez toujours créer manuellement de nouvelles versions de solution.