Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
Supprimer des utilisateurs et leurs données à l'aide d'une tâche de suppression de données
Après avoir importé des données, vous pouvez supprimer les utilisateurs et leurs données, y compris leurs métadonnées et leurs données d'interaction, d'un groupe de jeux de données. Vous pouvez supprimer des données utilisateur dans le cadre d'un programme de conformité, ou pour répondre aux demandes de suppression d'utilisateurs, ou pour maintenir vos données à jour en fonction de l'évolution de votre base d'utilisateurs.
Une fois que vous avez supprimé des utilisateurs, Amazon Personalize ne s'entraîne plus sur leurs données et ne prend plus en compte les utilisateurs lors de la génération de segments d'utilisateurs.
Pour supprimer les références aux utilisateurs dans les ensembles de données Amazon Personalize et les modèles d'un groupe de jeux de données, procédez comme suit :
-
Préparez un CSV fichier répertoriant userIds les utilisateurs à supprimer dans une colonne USER _ID.
-
Téléchargez le CSV fichier dans un compartiment Amazon S3. Votre rôle de service Amazon Personalize doit être autorisé à accéder à ce compartiment.
-
Créez une tâche de suppression de données. Une tâche de suppression de données est une tâche par lots qui supprime les utilisateurs et leurs données des modèles et des ensembles de données d'un groupe de jeux de données.
Rubriques
Directives et exigences
Les instructions et les exigences relatives à la suppression d'utilisateurs sont les suivantes :
-
Avant de créer une tâche de suppression de données, assurez-vous qu'aucune tâche utilisant vos ensembles de données n'est en cours, comme les tâches de formation, les tâches par lots ou les opérations d'importation groupées ou individuelles. Et évitez de créer de tels emplois pendant qu'une tâche de suppression de données est en cours. En cas de formation ou d'importation, nous ne pouvons pas garantir que les données des utilisateurs seront supprimées des modèles et nous vous recommandons de créer une tâche de suppression de données supplémentaire.
-
Une tâche de suppression de données ne supprime pas les références à des utilisateurs extérieurs à Amazon Personalize. Par exemple, cela ne les supprime pas userId des recommandations par lots dans votre compartiment Amazon S3. Vous devez supprimer ces enregistrements manuellement.
-
Vous pouvez avoir jusqu'à 5 tâches de suppression pour un groupe de jeux de données dont le statut est dePENDING.
-
La taille totale maximale de votre ou de vos fichiers d'entrée de suppression de données est de 50 Mo. Vous pouvez réutiliser le même fichier d'entrée lorsque vous créez des tâches de suppression.
-
Chaque tâche de suppression de données supprime les utilisateurs et leurs données d'interaction dans un groupe de jeux de données. Pour supprimer leurs données dans tous les groupes de jeux de données, vous devez créer une tâche de suppression de données pour chaque groupe de jeux de données.
-
Après avoir créé une tâche, la suppression des données des utilisateurs des ensembles de données et des modèles peut prendre jusqu'à un jour.
-
Une fois la tâche terminée, veillez à mettre à jour les ressources personnalisées. Assurez-vous de créer une nouvelle version de la solution et, si nécessaire, de mettre à jour votre campagne. Si vous utilisez l'entraînement automatique, vous pouvez toujours créer manuellement de nouvelles versions de solution.
-
Votre rôle de service Amazon Personalize doit être autorisé à accéder à votre compartiment Amazon S3 contenant la liste des utilisateurs à supprimer. Il a besoin
GetObject
d'ListBucket
autorisations et d'autorisations pour le bucket et son contenu. Ces autorisations sont identiques à celles relatives à l'importation de données. Pour plus d'informations sur l'octroi d'autorisations et des exemples de politiques, consultezPermettre à Amazon Personalize d'accéder aux ressources Amazon S3. -
Vous ne pouvez pas utiliser votre propre AWS Key Management Service clé dans le compartiment Amazon S3 qui stocke la liste userIds des utilisateurs à supprimer.
-
Si un élément apparaît uniquement dans votre jeu de données d'interactions entre articles et que seuls les utilisateurs que vous supprimez ont interagi avec cet élément, cet élément n'apparaîtra plus dans les recommandations.
Préparation d'une liste d'utilisateurs à supprimer
Avant de supprimer des utilisateurs d'Amazon Personalize, vous devez préparer une liste d'utilisateurs à supprimer dans un CSV fichier et la télécharger sur Amazon S3.
Pour préparer la liste des utilisateurs à supprimer et à télécharger
-
Créez un CSV fichier répertoriant userIds les utilisateurs à supprimer. Ce qui suit montre comment votre CSV fichier doit être formaté.
USER_ID abc 2a 5basc ab35 123f a55d 0v22 441fa efg
-
Chargez votre CSV fichier dans un compartiment Amazon Simple Storage Service (Amazon S3). Pour plus d'informations sur le chargement de fichiers vers Amazon S3, consultez la section Chargement de fichiers et de dossiers par glisser-déposer dans le guide de l'utilisateur d'Amazon Simple Storage Service.
-
Donnez à Amazon Personalize l'accès à votre bucket et à votre CSV fichier. Amazon Personalize doit être autorisé à exécuter les
ListBucket
actionsGetObject
et sur votre compartiment et son contenu. Ces autorisations sont identiques à celles relatives à l'importation de données. Pour plus d'informations sur l'octroi d'autorisations et des exemples de politiques, consultezPermettre à Amazon Personalize d'accéder aux ressources Amazon S3.
Création d'une tâche de suppression de données
Une fois que vous avez terminéPréparation d'une liste d'utilisateurs à supprimer, vous êtes prêt à supprimer les utilisateurs à l'aide d'une tâche de suppression de données.
Une tâche de suppression de données est une tâche par lots qui supprime les utilisateurs et leurs données des modèles et des ensembles de données d'un groupe de jeux de données. Une fois que vous avez supprimé des utilisateurs, Amazon Personalize ne s'entraîne plus sur leurs données et ne prend plus en compte les utilisateurs lors de la génération de segments d'utilisateurs.
Lorsque vous créez une tâche de suppression de données, vous spécifiez l'emplacement Amazon S3 de votre liste d'utilisateurs à supprimer.
-
Si vos données se trouvent dans un seul fichier, utilisez la syntaxe suivante pour l'emplacement Amazon S3 :
s3://amzn-s3-demo-bucket/<folder path>/<CSV filename>.csv
-
Si vos CSV fichiers se trouvent dans un dossier de votre compartiment Amazon S3, vous pouvez spécifier le chemin d'accès au dossier. Dans le cadre d'une tâche de suppression de données, Amazon Personalize utilise tous les fichiers portant l'extension de
.csv
fichier dans le dossier et dans n'importe quel sous-dossier. Il ignore les fichiers de tout autre type. Utilisez la syntaxe suivante avec un/
après le nom du dossier :s3://amzn-s3-demo-bucket/<folder path>/
Le rôle que vous utilisez doit être autorisé à exécuter les ListBucket
actions GetObject
et sur votre compartiment Amazon S3 et son contenu. Pour plus d'informations sur l'octroi d'autorisations et des exemples de politiques, consultezPermettre à Amazon Personalize d'accéder aux ressources Amazon S3.
Vous pouvez créer une tâche de suppression de données à l'aide de la console Amazon Personalize, du AWS Command Line Interface (AWS CLI) ou AWS SDKs.
Pour supprimer des utilisateurs à l'aide de la console Amazon Personalize, créez une tâche de suppression de données avec un nom, le rôle de IAM service et l'emplacement Amazon S3 de vos données.
Pour supprimer des enregistrements (console)
-
Ouvrez la console Amazon Personalize https://console.aws.amazon.com/personalize/chez
vous et connectez-vous à votre compte. -
Sur la page Groupes de jeux de données, choisissez votre groupe de jeux de données. L'aperçu du groupe de jeux de données s'affiche.
-
Dans le volet de navigation, sélectionnez Datasets.
-
Dans Tâches de suppression de données, choisissez Créer une tâche.
-
Dans Détails du job, nommez le job.
-
Dans Source d'entrée S3, pour S3 Location, spécifiez l'emplacement Amazon S3 du CSV fichier qui stocke la liste userIds des utilisateurs à supprimer. Vous avez préparé ce fichier enPréparation d'une liste d'utilisateurs à supprimer.
-
Dans IAMrôle, choisissez de créer un nouveau rôle ou d'utiliser un rôle existant. Si vous avez rempli les conditions requises pour créer un rôle pour Amazon Personalize et que vous avez accordé à ce rôle l'accès à votre compartiment Amazon S3, choisissez Utiliser un rôle de service existant et spécifiez le rôle dans Création d'un IAM rôle pour Amazon Personalize lequel vous l'avez créé.
Le rôle que vous utilisez doit être autorisé à exécuter les
ListBucket
actionsGetObject
et sur votre compartiment Amazon S3 et son contenu. Ces autorisations sont identiques à celles relatives à l'importation de données. Pour plus d'informations sur l'octroi d'autorisations et des exemples de politiques, consultezPermettre à Amazon Personalize d'accéder aux ressources Amazon S3. -
Pour les balises, ajoutez éventuellement des balises. Pour plus d'informations sur le balisage des ressources Amazon Personalize, consultezMarquer les ressources Amazon Personalize.
-
Choisissez Créer une tâche. La tâche démarre et la page de détails s'affiche.
Après avoir créé une tâche, il faut environ une journée pour supprimer les données des utilisateurs des ensembles de données et des modèles. Jusqu'à ce que le travail soit terminé, Amazon Personalize continue d'utiliser les données lors de la formation. Et les utilisateurs peuvent apparaître dans des segments d'utilisateurs.
La suppression des données est terminée lorsque le statut est indiqué commeCOMPLETED. Si la tâche échoue pour une raison quelconque, nous vous recommandons de créer une autre tâche de suppression de données. Une fois la tâche terminée, veillez à mettre à jour les ressources personnalisées. Assurez-vous de créer une nouvelle version de la solution et, si nécessaire, de mettre à jour votre campagne. Si vous utilisez l'entraînement automatique, vous pouvez toujours créer manuellement de nouvelles versions de solution.
Pour supprimer des utilisateurs avec le AWS CLI, utilisez la create-data-deletion-job
commande. Cette commande utilise l' CreateDataDeletion APIopération. Le code suivant montre comment créer une tâche de suppression de données. Pour utiliser le code, mettez-le à jour pour spécifier le nom des tâches, le IAM rôle dans Création d'un IAM rôle pour Amazon Personalize lequel vous les avez créées et l'emplacement de vos données sur Amazon S3. Vous avez préparé ce fichier enPréparation d'une liste d'utilisateurs à supprimer.
aws personalize create-data-deletion-job \ --job-name
deletion job name
\ --dataset-group-arndataset group ARN
\ --data-source dataLocation=s3://amzn-s3-demo-bucket
/filename
.csv \ --role-arnroleArn
Après avoir créé une tâche, il faut environ une journée pour supprimer les données des utilisateurs des ensembles de données et des modèles. Jusqu'à ce que le travail soit terminé, Amazon Personalize continue d'utiliser les données lors de la formation. Et les utilisateurs peuvent apparaître dans des segments d'utilisateurs.
La tâche est terminée lorsque le statut est atteintCOMPLETED. Vérifiez l'état à l'aide de la describe-data-deletion-job
commande et spécifiez la tâche de suppression des donnéesARN. Pour plus d'informations sur l'APIopération, consultezDescribeDataDeletionJob. Pour consulter l'historique des tâches de suppression de données triées par date de création, utilisez l'ListDataDeletionJobsAPIopération.
Si la tâche échoue pour une raison quelconque, nous vous recommandons de créer une autre tâche de suppression de données. Une fois la tâche terminée, veillez à mettre à jour les ressources personnalisées. Assurez-vous de créer une nouvelle version de la solution et, si nécessaire, de mettre à jour votre campagne. Si vous utilisez l'entraînement automatique, vous pouvez toujours créer manuellement de nouvelles versions de solution.
Pour supprimer des utilisateurs avec le AWS SDKs, utilisez l'CreateDataDeletionJobAPIopération. Le code suivant montre comment créer une tâche de suppression de données. Pour utiliser le code, mettez-le à jour pour spécifier le nom des tâches, le IAM rôle dans Création d'un IAM rôle pour Amazon Personalize lequel vous les avez créées et l'emplacement de vos données sur Amazon S3. Vous avez préparé ce fichier enPréparation d'une liste d'utilisateurs à supprimer.
import boto3 personalize = boto3.client('personalize') response = personalize.create_data_deletion_job( jobName = '
Deletion job name
', datasetGroupArn = 'Dataset Group ARN
', dataSource = {'dataLocation':'s3://amzn-s3-demo-bucket/file.csv
'}, roleArn = 'role_arn
' ) deletion_job_arn = response['dataDeletionJobArn'] print ('Deletion Job arn: ' + deletion_job_arn) description = personalize.describe_data_deletion_job( dataDeletionJobArn = deletion_job_arn)['dataDeletionJob'] print('Name: ' + description['jobName']) print('ARN: ' + description['dataDeletionJobArn']) print('Status: ' + description['status'])
Après avoir créé une tâche, il faut environ une journée pour supprimer les données des utilisateurs des ensembles de données et des modèles. Jusqu'à ce que le travail soit terminé, Amazon Personalize continue d'utiliser les données lors de la formation. Et les utilisateurs peuvent apparaître dans des segments d'utilisateurs.
La tâche est terminée lorsque le statut est atteintCOMPLETED. Vérifiez l'état à l'aide de l'DescribeDataDeletionJobopération et spécifiez la tâche de suppression des donnéesARN. Pour consulter l'historique des tâches de suppression de données triées par date de création, utilisez l'ListDataDeletionJobsAPIopération.
Si la tâche échoue pour une raison quelconque, nous vous recommandons de créer une autre tâche de suppression de données. Une fois la tâche terminée, veillez à mettre à jour les ressources personnalisées. Assurez-vous de créer une nouvelle version de la solution et, si nécessaire, de mettre à jour votre campagne. Si vous utilisez l'entraînement automatique, vous pouvez toujours créer manuellement de nouvelles versions de solution.