As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.
Excluir usuários e seus dados com um trabalho de exclusão de dados
Depois de importar os dados, você poderá excluir usuários e os respectivos dados, incluindo seus metadados e dados de interações, de um grupo de conjuntos de dados. Você pode excluir dados do usuário como parte de um programa de conformidade para atender às solicitações de exclusão do usuário ou para manter seus dados atualizados à medida que sua base de usuários muda.
Depois que você excluir os usuários, o Amazon Personalize deixa de treinar seus dados e não considera mais os usuários ao gerar segmentos de usuários.
Para excluir referências a usuários nos conjuntos de dados e modelos do Amazon Personalize em um grupo de conjuntos de dados, faça o seguinte:
-
Prepare um arquivo CSV que liste os UserIDs a serem excluídos de uma coluna USER_ID.
-
Faça upload do arquivo CSV para um bucket do Amazon S3. Seu perfil de serviço do Amazon Personalize deve ter permissão para acessar esse bucket.
-
Criar um trabalho de exclusão de dados. Um trabalho de exclusão de dados é um trabalho em lote que exclui usuários e seus dados dos modelos e conjuntos de dados de um grupo de conjuntos de dados.
Tópicos
Diretrizes e requisitos
Veja abaixo as diretrizes e os requisitos para excluir usuários:
-
Antes de criar um trabalho de exclusão de dados, certifique-se de que nenhum trabalho que use seus conjuntos de dados esteja em andamento, como trabalhos de treinamento, trabalhos em lote ou operações de importação em massa ou individuais. E evite criar esses trabalhos enquanto houver um trabalho de exclusão de dados em andamento. Se ocorrer algum treinamento ou importação, não podemos garantir que os dados dos usuários serão excluídos dos modelos e recomendamos criar um trabalho adicional de exclusão de dados.
-
Um trabalho de exclusão de dados não exclui referências a usuários fora do Amazon Personalize. Por exemplo, ele não exclui seu ID de usuário das recomendações de lote em seu bucket do Amazon S3. Será necessário excluir esses registros manualmente.
-
Você pode ter até 5 trabalhos de exclusão para um grupo de conjuntos de dados com o status pendente.
-
O tamanho total máximo do arquivo ou arquivos de entrada de exclusão de dados é de 100 MB. É possível reutilizar o mesmo arquivo de entrada ao criar trabalhos de exclusão.
-
Cada trabalho de exclusão de dados exclui usuários e seus dados de interação em um grupo de conjuntos de dados. Para excluir seus dados em todos os grupos de conjuntos de dados, você deve criar um trabalho de exclusão de dados para cada grupo de conjuntos de dados.
-
Depois que você criar um trabalho, poderá levar até um dia para excluir os dados dos usuários dos conjuntos de dados e modelos.
-
Depois que um trabalho for concluído, certifique-se de atualizar todos os recursos personalizados. Certifique-se de criar uma nova versão da solução e, se necessário, atualizar sua campanha. Se você usar o treinamento automático, ainda poderá criar manualmente novas versões da solução.
-
Seu perfil de serviço do Amazon Personalize deve ter permissão para acessar seu bucket do Amazon S3 com a lista de usuários a serem excluídos. Ele precisa de permissões
GetObject
eListBucket
para o bucket e seu conteúdo. Essas permissões são iguais às da importação de dados. Para obter informações sobre como conceder permissões e exemplos de políticas, consulte Como conceder permissão ao Amazon Personalize para acessar recursos do Amazon S3. -
Você não pode usar sua própria AWS Key Management Service chave no bucket do Amazon S3 que armazena sua lista de IDs de usuário dos usuários a serem excluídos.
-
Se um item aparecer somente no conjunto de dados de interações com itens e somente os usuários que você está excluindo interagirem com esse item, que não aparecerá mais nas recomendações.
Preparar uma lista de usuários a serem excluídos
Antes de excluir usuários do Amazon Personalize, você deve preparar uma lista de usuários a serem excluídos como um arquivo CSV e enviá-la para o Amazon S3.
Para preparar a lista de usuários a serem excluídos e fazer upload dela
-
Crie um arquivo CSV contendo os UserIDs a serem excluídos. Confira a seguir como seu arquivo CSV deve estar formatado.
USER_ID abc 2a 5basc ab35 123f a55d 0v22 441fa efg
-
Faça upload dos arquivos CSV para um bucket do Amazon Simple Storage Service (Amazon S3). Para obter mais informações sobre como fazer upload de arquivos no Amazon S3, consulte Upload de arquivos e pastas usando arrastar e soltar no Guia do usuário do Amazon Simple Storage Service.
-
Dê ao Amazon Personalize acesso ao bucket e ao arquivo CSV. O Amazon Personalize deve ter permissão para realizar as ações
GetObject
eListBucket
em seu bucket e conteúdo. Essas permissões são iguais às da importação de dados. Para obter informações sobre como conceder permissões e exemplos de políticas, consulte Como conceder permissão ao Amazon Personalize para acessar recursos do Amazon S3.
Criar um trabalho de exclusão de dados
Quando acabar de Preparar uma lista de usuários a serem excluídos, você poderá remover os usuários com um trabalho de exclusão de dados.
Um trabalho de exclusão de dados é um trabalho em lote que exclui usuários e seus dados dos modelos e conjuntos de dados de um grupo de conjuntos de dados. Depois que você excluir os usuários, o Amazon Personalize deixa de treinar seus dados e não considera mais os usuários ao gerar segmentos de usuários.
Ao criar um trabalho de exclusão de dados, especifique a localização do Amazon S3 da sua lista de usuários a serem excluídos.
-
Se seus dados estiverem em um único arquivo, use a seguinte sintaxe para localizar o Amazon S3:
s3://amzn-s3-demo-bucket/<folder path>/<CSV filename>.csv
-
Se seus arquivos CSV estiverem em uma pasta no bucket do Amazon S3, você poderá especificar o caminho da pasta. Com um trabalho de exclusão de dados, o Amazon Personalize usa todos os arquivos com a extensão de arquivo
.csv
na pasta e em qualquer subpasta. Ele ignora arquivos de qualquer outro tipo. Use a sintaxe a seguir com uma/
após o nome da pasta:s3://amzn-s3-demo-bucket/<folder path>/
O perfil que você usa deve ter permissão para realizar as ações ListBucket
e GetObject
e em seu bucket e conteúdo do Amazon S3. Para obter informações sobre como conceder permissões e exemplos de políticas, consulte Como conceder permissão ao Amazon Personalize para acessar recursos do Amazon S3.
Você pode criar um trabalho de exclusão de dados com o console Amazon Personalize, AWS Command Line Interface o AWS CLI() ou. AWS SDKs
Para excluir usuários com o console do Amazon Personalize, crie um trabalho de exclusão do conjunto de dados com um nome, o perfil de serviço do IAM e a localização do Amazon S3 dos seus dados.
Excluir registros (console)
-
Abra o console Amazon Personalize em https://console.aws.amazon.com/personalize/casa
e faça login na sua conta. -
Na página Grupos de conjuntos de dados, escolha seu grupo de conjuntos de dados. A visão geral do grupo de conjuntos de dados é exibida.
-
No painel de navegação, escolha Conjuntos de dados.
-
Em Trabalhos de exclusão de dados, escolha Criar trabalho.
-
Em Detalhes do trabalho, dê um nome a ela.
-
Na origem de entrada do S3, em Localização do S3, especifique a localização do Amazon S3 do arquivo CSV que armazena a lista de UserIDs a serem excluídos. Você preparou esse arquivo em Preparar uma lista de usuários a serem excluídos.
-
Em perfil do IAM, escolha entre criar um novo perfil ou usar um perfil existente. Se você preencheu os pré-requisitos para criar um perfil do Amazon Personalize e concedeu a esse perfil acesso ao bucket do Amazon S3, escolha Usar um perfil de serviço existente e especifique o perfil criado em Criar um perfil do IAM para o Amazon Personalize.
O perfil que você usa deve ter permissão para realizar as ações
ListBucket
eGetObject
e em seu bucket e conteúdo do Amazon S3. Essas permissões são iguais às da importação de dados. Para obter informações sobre como conceder permissões e exemplos de políticas, consulte Como conceder permissão ao Amazon Personalize para acessar recursos do Amazon S3. -
Para Tags, é possível adicionar quaisquer tags. Para obter mais informações sobre recursos de atribuição de tags do Amazon Personalize, consulte Usar tags nos recursos do Amazon Personalize.
-
Escolha Criar trabalho. O trabalho começa, e a página de detalhes é exibida.
Depois que você criar um trabalho, poderá levar até um dia para excluir os dados dos usuários dos conjuntos de dados e modelos. Até que o trabalho seja concluído, o Amazon Personalize continua usando os dados durante o treinamento. E os usuários podem aparecer em segmentos de usuários.
A exclusão dos dados terá terminado quando o status for Concluído. Se o trabalho falhar por algum motivo, recomendamos criar outro trabalho de exclusão de dados. Depois que um trabalho for concluído, certifique-se de atualizar todos os recursos personalizados. Certifique-se de criar uma nova versão da solução e, se necessário, atualizar sua campanha. Se você usar o treinamento automático, ainda poderá criar manualmente novas versões da solução.
Para excluir usuários com o AWS CLI, use o create-data-deletion-job
comando. Esse comando usa a operação da API CreateDataDeletion . O código a seguir mostra como criar um trabalho de exclusão dos dados. Para usar o código, atualize-o para especificar os nomes dos trabalhos, o perfil do IAM que você criou em Criar um perfil do IAM para o Amazon Personalize e a localização dos seus dados no Amazon S3. Você preparou esse arquivo em Preparar uma lista de usuários a serem excluídos.
aws personalize create-data-deletion-job \
--job-name deletion job name
\
--dataset-group-arn dataset group ARN
\
--data-source dataLocation=s3://amzn-s3-demo-bucket
/filename
.csv \
--role-arn roleArn
Depois que você criar um trabalho, poderá levar até um dia para excluir os dados dos usuários dos conjuntos de dados e modelos. Até que o trabalho seja concluído, o Amazon Personalize continua usando os dados durante o treinamento. E os usuários podem aparecer em segmentos de usuários.
O status é Concluído quando o trabalho termina. Verifique o status usando o comando describe-data-deletion-job
e especifique o ARN do trabalho de exclusão de dados. Para obter mais informações sobre as operações da API, consulte DescribeDataDeletionJob. Para conferir um histórico de trabalhos de exclusão de dados classificados de acordo com a hora de criação, use a operação da API ListDataDeletionJobs.
Se o trabalho falhar por algum motivo, recomendamos criar outro trabalho de exclusão de dados. Depois que um trabalho for concluído, certifique-se de atualizar todos os recursos personalizados. Certifique-se de criar uma nova versão da solução e, se necessário, atualizar sua campanha. Se você usar o treinamento automático, ainda poderá criar manualmente novas versões da solução.
Para excluir usuários com o AWS SDKs, use a operação CreateDataDeletionJob da API. O código a seguir mostra como criar um trabalho de exclusão dos dados. Para usar o código, atualize-o para especificar os nomes dos trabalhos, o perfil do IAM que você criou em Criar um perfil do IAM para o Amazon Personalize e a localização dos seus dados no Amazon S3. Você preparou esse arquivo em Preparar uma lista de usuários a serem excluídos.
import boto3
personalize = boto3.client('personalize')
response = personalize.create_data_deletion_job(
jobName = 'Deletion job name
',
datasetGroupArn = 'Dataset Group ARN
',
dataSource = {'dataLocation':'s3://amzn-s3-demo-bucket/file.csv
'},
roleArn = 'role_arn
'
)
deletion_job_arn = response['dataDeletionJobArn']
print ('Deletion Job arn: ' + deletion_job_arn)
description = personalize.describe_data_deletion_job(
dataDeletionJobArn = deletion_job_arn)['dataDeletionJob']
print('Name: ' + description['jobName'])
print('ARN: ' + description['dataDeletionJobArn'])
print('Status: ' + description['status'])
Depois que você criar um trabalho, poderá levar até um dia para excluir os dados dos usuários dos conjuntos de dados e modelos. Até que o trabalho seja concluído, o Amazon Personalize continua usando os dados durante o treinamento. E os usuários podem aparecer em segmentos de usuários.
O status é Concluído quando o trabalho termina. Verifique o status usando a operação DescribeDataDeletionJob e especifique o ARN do trabalho de exclusão de dados. Para conferir um histórico de trabalhos de exclusão de dados classificados de acordo com a hora de criação, use a operação da API ListDataDeletionJobs.
Se o trabalho falhar por algum motivo, recomendamos criar outro trabalho de exclusão de dados. Depois que um trabalho for concluído, certifique-se de atualizar todos os recursos personalizados. Certifique-se de criar uma nova versão da solução e, se necessário, atualizar sua campanha. Se você usar o treinamento automático, ainda poderá criar manualmente novas versões da solução.