Diretrizes e requisitos Preparando uma lista de usuários a serem excluídos Criação de um trabalho de exclusão de dados

Excluindo usuários e seus dados com um trabalho de exclusão de dados

Depois de importar dados, você pode excluir usuários e seus dados, incluindo seus metadados e dados de interações, de um grupo de conjuntos de dados. Você pode excluir dados do usuário como parte de um programa de conformidade, para atender às solicitações de exclusão do usuário ou para manter seus dados atualizados à medida que sua base de usuários muda.

Depois de excluir usuários, o Amazon Personalize não treina mais seus dados e não considera mais os usuários ao gerar segmentos de usuários.

Para excluir referências a usuários nos conjuntos de dados e modelos do Amazon Personalize em um grupo de conjuntos de dados, faça o seguinte:

Prepare um CSV arquivo que liste os usuários a serem excluídos em uma coluna USER _ID. userIds
Faça o upload do CSV arquivo em um bucket do Amazon S3. Sua função de serviço Amazon Personalize deve ter permissão para acessar esse bucket.
Crie um trabalho de exclusão de dados. Um trabalho de exclusão de dados é um trabalho em lotes que exclui usuários e seus dados dos modelos e conjuntos de dados em um grupo de conjuntos de dados.

Tópicos

Diretrizes e requisitos
Preparando uma lista de usuários a serem excluídos
Criação de um trabalho de exclusão de dados

Diretrizes e requisitos

A seguir estão as diretrizes e os requisitos para excluir usuários:

Antes de criar um trabalho de exclusão de dados, certifique-se de que nenhum trabalho que use seus conjuntos de dados esteja em andamento, como trabalhos de treinamento, trabalhos em lotes ou operações de importação em massa ou individuais. E evite criar esses trabalhos enquanto um trabalho de exclusão de dados estiver em andamento. Se ocorrer algum treinamento ou importação, não podemos garantir que os dados dos usuários serão excluídos dos modelos e recomendamos a criação de um trabalho adicional de exclusão de dados.
Um trabalho de exclusão de dados não exclui referências a usuários fora do Amazon Personalize. Por exemplo, ele não os exclui das recomendações userId de lote em seu bucket do Amazon S3. Você deve excluir manualmente esses registros.
Você pode ter até 5 trabalhos de exclusão para um grupo de conjuntos de dados com o status de. PENDING
O tamanho total máximo do arquivo ou arquivos de entrada de exclusão de dados é de 50 MB. Você pode reutilizar o mesmo arquivo de entrada ao criar trabalhos de exclusão.
Cada tarefa de exclusão de dados exclui usuários e seus dados de interação em um grupo de conjuntos de dados. Para excluir seus dados em todos os grupos de conjuntos de dados, você deve criar um trabalho de exclusão de dados para cada grupo de conjuntos de dados.
Depois de criar um trabalho, pode levar até um dia para excluir os dados dos usuários dos conjuntos de dados e modelos.
Depois que um trabalho for concluído, certifique-se de atualizar todos os recursos personalizados. Certifique-se de criar uma nova versão da solução e, se necessário, atualizar sua campanha. Se você usar o treinamento automático, ainda poderá criar manualmente novas versões da solução.
Sua função de serviço Amazon Personalize deve ter permissão para acessar seu bucket do Amazon S3 com a lista de usuários a serem excluídos. Ele precisa GetObject e tem ListBucket permissões para o bucket e seu conteúdo. Essas permissões são iguais às da importação de dados. Para obter informações sobre como conceder permissões e exemplos de políticas, consulteComo conceder permissão ao Amazon Personalize para acessar recursos do Amazon S3.
Você não pode usar sua própria AWS Key Management Service chave no bucket do Amazon S3 que armazena sua lista userIds de usuários a serem excluídos.
Se um item aparecer somente no conjunto de dados de interações do item e somente os usuários que você está excluindo interagirem com esse item, esse item não aparecerá mais nas recomendações.

Preparando uma lista de usuários a serem excluídos

Antes de excluir usuários do Amazon Personalize, você deve preparar uma lista de usuários para excluir em um CSV arquivo e enviá-la para o Amazon S3.

Para preparar a lista de usuários para excluí-la e carregá-la

Crie um CSV arquivo que liste userIds os usuários a serem excluídos. Veja a seguir como seu CSV arquivo deve ser formatado.
```
USER_ID
abc
2a
5basc
ab35
123f
a55d
0v22
441fa
efg
```
Faça upload CSV do seu arquivo em um bucket do Amazon Simple Storage Service (Amazon S3). Para obter mais informações sobre o upload de arquivos para o Amazon S3, consulte Carregar arquivos e pastas usando o recurso de arrastar e soltar no Guia do usuário do Amazon Simple Storage Service.
Dê ao Amazon Personalize acesso ao seu bucket e ao seu arquivo. CSV O Amazon Personalize deve ter permissão para realizar as ListBucket ações GetObject e em seu bucket e em seu conteúdo. Essas permissões são iguais às da importação de dados. Para obter informações sobre como conceder permissões e exemplos de políticas, consulteComo conceder permissão ao Amazon Personalize para acessar recursos do Amazon S3.

Criação de um trabalho de exclusão de dados

Depois de concluirPreparando uma lista de usuários a serem excluídos, você estará pronto para excluir os usuários com um trabalho de exclusão de dados.

Um trabalho de exclusão de dados é um trabalho em lotes que exclui usuários e seus dados dos modelos e conjuntos de dados em um grupo de conjuntos de dados. Depois de excluir usuários, o Amazon Personalize não treina mais seus dados e não considera mais os usuários ao gerar segmentos de usuários.

Ao criar um trabalho de exclusão de dados, você especifica a localização do Amazon S3 da sua lista de usuários a serem excluídos.

Se seus dados estiverem em um único arquivo, use a seguinte sintaxe para a localização do Amazon S3:

s3://amzn-s3-demo-bucket/<folder path>/<CSV filename>.csv
Se seus CSV arquivos estiverem em uma pasta no bucket do Amazon S3, você poderá especificar o caminho para a pasta. Com um trabalho de exclusão de dados, o Amazon Personalize usa todos os arquivos com .csv a extensão de arquivo na pasta e em qualquer subpasta. Ele ignora arquivos de qualquer outro tipo. Use a sintaxe a seguir com uma / após o nome da pasta:

s3://amzn-s3-demo-bucket/<folder path>/

A função que você usa deve ter permissão para realizar as ListBucket ações GetObject e em seu bucket do Amazon S3 e seu conteúdo. Para obter informações sobre como conceder permissões e exemplos de políticas, consulteComo conceder permissão ao Amazon Personalize para acessar recursos do Amazon S3.

Você pode criar um trabalho de exclusão de dados com o console Amazon Personalize, AWS Command Line Interface o AWS CLI() ou. AWS SDKs

Para excluir usuários com o console Amazon Personalize, crie um trabalho de exclusão de dados com um nome, a função do IAM serviço e a localização dos seus dados no Amazon S3.

Para excluir registros (console)

Abra o console Amazon Personalize em https://console.aws.amazon.com/personalize/casa e faça login na sua conta.
Na página Grupos de conjuntos de dados, escolha seu grupo de conjuntos de dados. A visão geral do grupo de conjuntos de dados é exibida.
No painel de navegação, selecione Conjuntos de dados.
Em Trabalhos de exclusão de dados, escolha Criar trabalho.
Em Detalhes do trabalho, dê um nome ao trabalho.
Na fonte de entrada do S3, em S3 Location, especifique a localização do Amazon S3 do arquivo que armazena CSV a lista userIds dos usuários a serem excluídos. Você preparou esse arquivo emPreparando uma lista de usuários a serem excluídos.
Em IAMfunção, escolha criar uma nova função ou usar uma existente. Se você preencheu os pré-requisitos para criar uma função para o Amazon Personalize e concedeu a essa função acesso ao seu bucket do Amazon S3, escolha Usar uma função de serviço existente e especifique a função na qual você criou. Criação de uma IAM função para o Amazon Personalize

A função que você usa deve ter permissão para realizar as ListBucket ações GetObject e em seu bucket do Amazon S3 e seu conteúdo. Essas permissões são iguais às da importação de dados. Para obter informações sobre como conceder permissões e exemplos de políticas, consulteComo conceder permissão ao Amazon Personalize para acessar recursos do Amazon S3.
Para Tags, é possível adicionar quaisquer tags. Para obter mais informações sobre recursos de atribuição de tags do Amazon Personalize, consulte Usar tags nos recursos do Amazon Personalize.
Escolha Criar trabalho. O trabalho é iniciado e a página de detalhes é exibida.

Depois de criar um trabalho, leva cerca de um dia para excluir os dados dos usuários dos conjuntos de dados e modelos. Até que o trabalho seja concluído, o Amazon Personalize continua usando os dados durante o treinamento. E os usuários podem aparecer em segmentos de usuários.

A exclusão de dados é concluída quando o status é exibido comoCOMPLETED. Se o trabalho falhar por algum motivo, recomendamos criar outro trabalho de exclusão de dados. Depois que um trabalho for concluído, certifique-se de atualizar todos os recursos personalizados. Certifique-se de criar uma nova versão da solução e, se necessário, atualizar sua campanha. Se você usar o treinamento automático, ainda poderá criar manualmente novas versões da solução.

Para excluir usuários com o AWS CLI, use o create-data-deletion-job comando. Esse comando usa a CreateDataDeletion API operação. O código a seguir mostra como criar um trabalho de exclusão de dados. Para usar o código, atualize-o para especificar o nome do trabalho, a IAM função na Criação de uma IAM função para o Amazon Personalize qual você criou e a localização dos seus dados no Amazon S3. Você preparou esse arquivo emPreparando uma lista de usuários a serem excluídos.


aws personalize create-data-deletion-job \
--job-name deletion job name \
--dataset-group-arn dataset group ARN \
--data-source dataLocation=s3://amzn-s3-demo-bucket/filename.csv \
--role-arn roleArn

Depois de criar um trabalho, leva cerca de um dia para excluir os dados dos usuários dos conjuntos de dados e modelos. Até que o trabalho seja concluído, o Amazon Personalize continua usando os dados durante o treinamento. E os usuários podem aparecer em segmentos de usuários.

O trabalho é concluído quando o status éCOMPLETED. Verifique o status usando o describe-data-deletion-job comando e especifique o trabalho ARN de exclusão de dados. Para obter mais informações sobre a API operação, consulteDescribeDataDeletionJob. Para visualizar um histórico das tarefas de exclusão de dados classificadas por hora de criação, use a ListDataDeletionJobs API operação.

Se o trabalho falhar por algum motivo, recomendamos criar outro trabalho de exclusão de dados. Depois que um trabalho for concluído, certifique-se de atualizar todos os recursos personalizados. Certifique-se de criar uma nova versão da solução e, se necessário, atualizar sua campanha. Se você usar o treinamento automático, ainda poderá criar manualmente novas versões da solução.

Para excluir usuários com o AWS SDKs, use a CreateDataDeletionJob API operação. O código a seguir mostra como criar um trabalho de exclusão de dados. Para usar o código, atualize-o para especificar o nome do trabalho, a IAM função na Criação de uma IAM função para o Amazon Personalize qual você criou e a localização dos seus dados no Amazon S3. Você preparou esse arquivo emPreparando uma lista de usuários a serem excluídos.


import boto3

personalize = boto3.client('personalize')

response = personalize.create_data_deletion_job(
    jobName = 'Deletion job name',
    datasetGroupArn = 'Dataset Group ARN',
    dataSource = {'dataLocation':'s3://amzn-s3-demo-bucket/file.csv'},
    roleArn = 'role_arn'
)

deletion_job_arn = response['dataDeletionJobArn']

print ('Deletion Job arn: ' + deletion_job_arn)

description = personalize.describe_data_deletion_job(
    dataDeletionJobArn = deletion_job_arn)['dataDeletionJob']

print('Name: ' + description['jobName'])
print('ARN: ' + description['dataDeletionJobArn'])
print('Status: ' + description['status'])

O trabalho é concluído quando o status éCOMPLETED. Verifique o status usando a DescribeDataDeletionJob operação e especifique o trabalho ARN de exclusão de dados. Para visualizar um histórico das tarefas de exclusão de dados classificadas por hora de criação, use a ListDataDeletionJobs API operação.

Atenção O Javascript está desativado ou não está disponível no seu navegador.

Para usar a documentação da AWS, o Javascript deve estar ativado. Consulte as páginas de Ajuda do navegador para obter instruções.

Convenções do documento

Excluir recursos

Excluir um conjunto de dados