Excluindo usuários e seus dados com um trabalho de exclusão de dados - Amazon Personalize

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Excluindo usuários e seus dados com um trabalho de exclusão de dados

Depois de importar dados, você pode excluir usuários e seus dados, incluindo seus metadados e dados de interações, de um grupo de conjuntos de dados. Você pode excluir dados do usuário como parte de um programa de conformidade, para atender às solicitações de exclusão do usuário ou para manter seus dados atualizados à medida que sua base de usuários muda.

Depois de excluir usuários, o Amazon Personalize não treina mais seus dados e não considera mais os usuários ao gerar segmentos de usuários.

Para excluir referências a usuários nos conjuntos de dados e modelos do Amazon Personalize em um grupo de conjuntos de dados, faça o seguinte:

  1. Prepare um arquivo CSV que liste os UserIDs dos usuários a serem excluídos em uma coluna USER_ID.

  2. Faça o upload do arquivo CSV em um bucket do Amazon S3. Sua função de serviço Amazon Personalize deve ter permissão para acessar esse bucket.

  3. Crie um trabalho de exclusão de dados. Um trabalho de exclusão de dados é um trabalho em lotes que exclui usuários e seus dados dos modelos e conjuntos de dados em um grupo de conjuntos de dados.

Diretrizes e requisitos

A seguir estão as diretrizes e os requisitos para excluir usuários:

  • Antes de criar um trabalho de exclusão de dados, certifique-se de que nenhum trabalho que use seus conjuntos de dados esteja em andamento, como trabalhos de treinamento, trabalhos em lotes ou operações de importação em massa ou individuais. E evite criar esses trabalhos enquanto um trabalho de exclusão de dados estiver em andamento. Se ocorrer algum treinamento ou importação, não podemos garantir que os dados dos usuários serão excluídos dos modelos e recomendamos a criação de um trabalho adicional de exclusão de dados.

  • Um trabalho de exclusão de dados não exclui referências a usuários fora do Amazon Personalize. Por exemplo, ele não exclui seu ID de usuário das recomendações de lote em seu bucket do Amazon S3. Você deve excluir manualmente esses registros.

  • Você pode ter até 5 trabalhos de exclusão para um grupo de conjuntos de dados com o status PENDENTE.

  • O tamanho total máximo do arquivo ou arquivos de entrada de exclusão de dados é de 50 MB. Você pode reutilizar o mesmo arquivo de entrada ao criar trabalhos de exclusão.

  • Cada tarefa de exclusão de dados exclui usuários e seus dados de interação em um grupo de conjuntos de dados. Para excluir seus dados em todos os grupos de conjuntos de dados, você deve criar um trabalho de exclusão de dados para cada grupo de conjuntos de dados.

  • Depois de criar um trabalho, pode levar até um dia para excluir os dados dos usuários dos conjuntos de dados e modelos.

  • Depois que um trabalho for concluído, certifique-se de atualizar todos os recursos personalizados. Certifique-se de criar uma nova versão da solução e, se necessário, atualizar sua campanha. Se você usar o treinamento automático, ainda poderá criar manualmente novas versões da solução.

  • Sua função de serviço Amazon Personalize deve ter permissão para acessar seu bucket do Amazon S3 com a lista de usuários a serem excluídos. Ele precisa GetObject e tem ListBucket permissões para o bucket e seu conteúdo. Essas permissões são iguais às da importação de dados. Para obter informações sobre como conceder permissões e exemplos de políticas, consulteComo conceder permissão ao Amazon Personalize para acessar recursos do Amazon S3.

  • Você não pode usar sua própria AWS Key Management Service chave no bucket do Amazon S3 que armazena sua lista de IDs de usuário dos usuários a serem excluídos.

  • Se um item aparecer somente no conjunto de dados de interações do item e somente os usuários que você está excluindo interagirem com esse item, esse item não aparecerá mais nas recomendações.

Preparando uma lista de usuários a serem excluídos

Antes de excluir usuários do Amazon Personalize, você deve preparar uma lista de usuários para excluir em um arquivo CSV e enviá-la para o Amazon S3.

Para preparar a lista de usuários para excluí-la e carregá-la
  1. Crie um arquivo CSV que liste os IDs de usuário dos usuários a serem excluídos. Veja a seguir como seu arquivo CSV deve ser formatado.

    USER_ID abc 2a 5basc ab35 123f a55d 0v22 441fa efg
  2. Faça upload do seu arquivo CSV em um bucket do Amazon Simple Storage Service (Amazon S3). Para obter mais informações sobre o upload de arquivos para o Amazon S3, consulte Carregar arquivos e pastas usando o recurso de arrastar e soltar no Guia do usuário do Amazon Simple Storage Service.

  3. Dê ao Amazon Personalize acesso ao seu bucket e ao seu arquivo CSV. O Amazon Personalize deve ter permissão para realizar as ListBucket ações GetObject e em seu bucket e em seu conteúdo. Essas permissões são iguais às da importação de dados. Para obter informações sobre como conceder permissões e exemplos de políticas, consulteComo conceder permissão ao Amazon Personalize para acessar recursos do Amazon S3.

Criação de um trabalho de exclusão de dados

Depois de concluirPreparando uma lista de usuários a serem excluídos, você estará pronto para excluir os usuários com um trabalho de exclusão de dados.

Um trabalho de exclusão de dados é um trabalho em lotes que exclui usuários e seus dados dos modelos e conjuntos de dados em um grupo de conjuntos de dados. Depois de excluir usuários, o Amazon Personalize não treina mais seus dados e não considera mais os usuários ao gerar segmentos de usuários.

Ao criar um trabalho de exclusão de dados, você especifica a localização do Amazon S3 da sua lista de usuários a serem excluídos.

  • Se seus dados estiverem em um único arquivo, use a seguinte sintaxe para a localização do Amazon S3:

    s3://<name of your S3 bucket>/<folder path>/<CSV filename>.csv

  • Se seus arquivos CSV estiverem em uma pasta no bucket do Amazon S3, você poderá especificar o caminho para a pasta. Com um trabalho de exclusão de dados, o Amazon Personalize usa todos os arquivos com .csv a extensão de arquivo na pasta e em qualquer subpasta. Ele ignora arquivos de qualquer outro tipo. Use a sintaxe a seguir com uma / após o nome da pasta:

    s3://<name of your S3 bucket>/<folder path>/

A função que você usa deve ter permissão para realizar as ListBucket ações GetObject e em seu bucket do Amazon S3 e seu conteúdo. Para obter informações sobre como conceder permissões e exemplos de políticas, consulteComo conceder permissão ao Amazon Personalize para acessar recursos do Amazon S3.

Você pode criar um trabalho de exclusão de dados com o console Amazon Personalize, AWS Command Line Interface o AWS CLI() ou os SDKs. AWS

Para excluir usuários com o console Amazon Personalize, crie um trabalho de exclusão de dados com um nome, a função de serviço do IAM e a localização dos seus dados no Amazon S3.

Para excluir registros (console)
  1. Acesse https://console.aws.amazon.com/personalize/home, abra o console do Amazon Personalize e faça login na sua conta.

  2. Na página Grupos de conjuntos de dados, escolha seu grupo de conjuntos de dados. A visão geral do grupo de conjuntos de dados é exibida.

  3. No painel de navegação, selecione Conjuntos de dados.

  4. Em Trabalhos de exclusão de dados, escolha Criar trabalho.

  5. Em Detalhes do trabalho, dê um nome ao trabalho.

  6. Na fonte de entrada do S3, em Localização do S3, especifique a localização do arquivo CSV no Amazon S3 que armazena a lista de IDs de usuário dos usuários a serem excluídos. Você preparou esse arquivo emPreparando uma lista de usuários a serem excluídos.

  7. Em perfil do IAM, escolha entre criar um novo perfil ou usar um perfil existente. Se você preencheu os pré-requisitos para criar uma função para o Amazon Personalize e concedeu a essa função acesso ao seu bucket do Amazon S3, escolha Usar uma função de serviço existente e especifique a função na qual você criou. Criar um perfil do IAM para o Amazon Personalize

    A função que você usa deve ter permissão para realizar as ListBucket ações GetObject e em seu bucket do Amazon S3 e seu conteúdo. Essas permissões são iguais às da importação de dados. Para obter informações sobre como conceder permissões e exemplos de políticas, consulteComo conceder permissão ao Amazon Personalize para acessar recursos do Amazon S3.

  8. Para Tags, é possível adicionar quaisquer tags. Para obter mais informações sobre recursos de atribuição de tags do Amazon Personalize, consulte Usar tags nos recursos do Amazon Personalize.

  9. Escolha Criar trabalho. O trabalho é iniciado e a página de detalhes é exibida.

    Depois de criar um trabalho, leva cerca de um dia para excluir os dados dos usuários dos conjuntos de dados e modelos. Até que o trabalho seja concluído, o Amazon Personalize continua usando os dados durante o treinamento. E os usuários podem aparecer em segmentos de usuários.

    A exclusão de dados é concluída quando o status é exibido como CONCLUÍDO. Se o trabalho falhar por algum motivo, recomendamos criar outro trabalho de exclusão de dados. Depois que um trabalho for concluído, certifique-se de atualizar todos os recursos personalizados. Certifique-se de criar uma nova versão da solução e, se necessário, atualizar sua campanha. Se você usar o treinamento automático, ainda poderá criar manualmente novas versões da solução.

Para excluir usuários com o AWS CLI, use o create-data-deletion-job comando. Esse comando usa a operação CreateDataDeletion da API. O código a seguir mostra como criar um trabalho de exclusão de dados. Para usar o código, atualize-o para especificar o nome do trabalho, a função do IAM que você criou e a localização dos seus dados no Criar um perfil do IAM para o Amazon Personalize Amazon S3. Você preparou esse arquivo emPreparando uma lista de usuários a serem excluídos.

aws personalize create-data-deletion-job \ --job-name deletion job name \ --dataset-group-arn dataset group ARN \ --data-source dataLocation=s3://bucketname/filename.csv \ --role-arn roleArn

Depois de criar um trabalho, leva cerca de um dia para excluir os dados dos usuários dos conjuntos de dados e modelos. Até que o trabalho seja concluído, o Amazon Personalize continua usando os dados durante o treinamento. E os usuários podem aparecer em segmentos de usuários.

O trabalho será concluído quando o status for CONCLUÍDO. Verifique o status usando o describe-data-deletion-job comando e especifique o ARN da tarefa de exclusão de dados. Para obter mais informações sobre a operação da API, consulteDescribeDataDeletionJob. Para ver um histórico de trabalhos de exclusão de dados classificados por hora de criação, use a operação da ListDataDeletionJobs API.

Se o trabalho falhar por algum motivo, recomendamos criar outro trabalho de exclusão de dados. Depois que um trabalho for concluído, certifique-se de atualizar todos os recursos personalizados. Certifique-se de criar uma nova versão da solução e, se necessário, atualizar sua campanha. Se você usar o treinamento automático, ainda poderá criar manualmente novas versões da solução.

Para excluir usuários com os AWS SDKs, use a operação de CreateDataDeletionJob API. O código a seguir mostra como criar um trabalho de exclusão de dados. Para usar o código, atualize-o para especificar o nome do trabalho, a função do IAM que você criou e a localização dos seus dados no Criar um perfil do IAM para o Amazon Personalize Amazon S3. Você preparou esse arquivo emPreparando uma lista de usuários a serem excluídos.

import boto3 personalize = boto3.client('personalize') response = personalize.create_data_deletion_job( jobName = 'Deletion job name', datasetGroupArn = 'Dataset Group ARN', dataSource = {'dataLocation':'s3://bucket/file.csv'}, roleArn = 'role_arn' ) deletion_job_arn = response['dataDeletionJobArn'] print ('Deletion Job arn: ' + deletion_job_arn) description = personalize.describe_data_deletion_job( dataDeletionJobArn = deletion_job_arn)['dataDeletionJob'] print('Name: ' + description['jobName']) print('ARN: ' + description['dataDeletionJobArn']) print('Status: ' + description['status'])

Depois de criar um trabalho, leva cerca de um dia para excluir os dados dos usuários dos conjuntos de dados e modelos. Até que o trabalho seja concluído, o Amazon Personalize continua usando os dados durante o treinamento. E os usuários podem aparecer em segmentos de usuários.

O trabalho será concluído quando o status for CONCLUÍDO. Verifique o status usando a DescribeDataDeletionJob operação e especifique o ARN da tarefa de exclusão de dados. Para ver um histórico de trabalhos de exclusão de dados classificados por hora de criação, use a operação da ListDataDeletionJobs API.

Se o trabalho falhar por algum motivo, recomendamos criar outro trabalho de exclusão de dados. Depois que um trabalho for concluído, certifique-se de atualizar todos os recursos personalizados. Certifique-se de criar uma nova versão da solução e, se necessário, atualizar sua campanha. Se você usar o treinamento automático, ainda poderá criar manualmente novas versões da solução.