CreateDatasetImportJob - Amazon Personalize

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

CreateDatasetImportJob

Cria um trabalho que importa dados de treinamento de uma fonte de dados (bucket do Amazon S3) para um conjunto de dados do Amazon Personalize. Para permitir que o Amazon Personalize importe os dados de treinamento, você deve especificar um perfil de serviço do IAM que tenha permissão para ler a fonte de dados, pois o Amazon Personalize faz uma cópia dos seus dados e os processa internamente. Para obter informações sobre como conceder acesso ao bucket do Amazon S3, consulte Conceder ao Amazon Personalize acesso aos recursos do Amazon S3.

Se você já criou um recomendador ou implantou uma versão da solução personalizada com uma campanha, a forma como os novos registros em massa influenciam as recomendações depende do caso de uso de domínio ou da fórmula que você usa. Para obter mais informações, consulte Como os novos dados influenciam as recomendações em tempo real.

Importante

Por padrão, um trabalho de importação do conjunto de dados substitui todos os dados existentes no conjunto de dados que você importou em massa. Para adicionar novos registros sem substituir os dados existentes, especifique INCREMENTAL para o modo de importação na CreateDatasetImportJob operação.

Status

Um trabalho de importação do conjunto de dados pode estar em um dos seguintes estados:

  • CREATE PENDING > CREATE IN_PROGRESS > ACTIVE -or- CREATE FAILED

Para obter o status do trabalho de importação, ligue DescribeDatasetImportJob, fornecendo o Amazon Resource Name (ARN) do trabalho de importação do conjunto de dados. A exportação do conjunto de dados estará concluída quando o status for ACTIVE. Se o status for exibido como CREATE FAILED, a resposta incluirá uma chave failureReason que descreve por que o trabalho falhou.

nota

A importação é demorada. Você deve aguardar até que o status seja ACTIVE antes de treinar um modelo usando o conjunto de dados.

Sintaxe da Solicitação

{ "datasetArn": "string", "dataSource": { "dataLocation": "string" }, "importMode": "string", "jobName": "string", "publishAttributionMetricsToS3": boolean, "roleArn": "string", "tags": [ { "tagKey": "string", "tagValue": "string" } ] }

Parâmetros da solicitação

A solicitação aceita os dados a seguir no formato JSON.

datasetArn

O ARN do conjunto de dados que recebe os dados importados.

Tipo: string

Restrições de tamanho: o tamanho máximo é 256.

Padrão: arn:([a-z\d-]+):personalize:.*:.*:.+

Exigido: Sim

dataSource

O bucket do Amazon S3 que contém os dados de treinamento a importar.

Tipo: objeto DataSource

Obrigatório: Sim

importMode

Especifique como adicionar os novos registros a um conjunto de dados existente. O modo de importação padrão é FULL. Se você não importou registros em massa para o conjunto de dados anteriormente, só pode especificar FULL.

  • Especifique FULL para substituir todos os dados em massa existentes no seu conjunto de dados. Os dados que você importou individualmente não são substituídos.

  • Especifique INCREMENTAL para acrescentar os novos registros aos dados existentes no seu conjunto de dados. O Amazon Personalize substitui qualquer registro com o mesmo ID pelo novo.

Tipo: String

Valores Válidos: FULL | INCREMENTAL

Obrigatório: não

jobName

O nome do trabalho de importação do conjunto de dados.

Tipo: string

Restrições de tamanho: o tamanho mínimo é 1. O tamanho máximo é 63.

Padrão: ^[a-zA-Z0-9][a-zA-Z0-9\-_]*

Exigido: Sim

publishAttributionMetricsToS3

Se você criou uma atribuição de métrica, especifique se deseja publicar métricas para esse trabalho de importação no Amazon S3

Tipo: booliano

Obrigatório: não

roleArn

O ARN do perfil do IAM que tem permissão para ler a fonte de dados do Amazon S3.

Tipo: string

Restrições de tamanho: o tamanho máximo é 256.

Padrão: arn:([a-z\d-]+):iam::\d{12}:role/?[a-zA-Z_0-9+=,.@\-_/]+

Exigido: Sim

tags

Uma lista de tags a serem aplicadas ao trabalho de importação do conjunto de dados.

Tipo: matriz de objetos Tag

Membros da Matriz: número mínimo de 0 itens. Número máximo de 200 itens.

Obrigatório: Não

Sintaxe da Resposta

{ "datasetImportJobArn": "string" }

Elementos de Resposta

Se a ação tiver êxito, o serviço enviará de volta uma resposta HTTP 200.

Os dados a seguir são retornados no formato JSON pelo serviço.

datasetImportJobArn

O ARN do trabalho de importação do conjunto de dados.

Tipo: string

Restrições de tamanho: o tamanho máximo é 256.

Padrão: arn:([a-z\d-]+):personalize:.*:.*:.+

Erros

InvalidInputException

Forneça um valor válido para o campo ou parâmetro.

Código de Status HTTP: 400

LimitExceededException

O limite de número de solicitações por segundo foi excedido.

Código de Status HTTP: 400

ResourceAlreadyExistsException

O recurso especificado já existe.

Código de Status HTTP: 400

ResourceInUseException

O recurso especificado está em uso.

Código de Status HTTP: 400

ResourceNotFoundException

Não foi possível encontrar o recurso especificado.

Código de Status HTTP: 400

TooManyTagsException

Você excedeu o número máximo de tags que pode aplicar a esse recurso.

Código de Status HTTP: 400

Consulte também

Para obter mais informações sobre como usar essa API em um dos AWS SDKs específicos da linguagem, consulte o seguinte: