CreateDatasetImportJob - Amazon Personalize

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

CreateDatasetImportJob

Crea un trabajo que importa datos de entrenamiento de un origen de datos (bucket de Amazon S3) a un conjunto de datos de Amazon Personalize. Para permitir que Amazon Personalize importe los datos de entrenamiento, debe especificar un rol de servicio de IAM que tenga permiso para leer el origen de datos, ya que Amazon Personalize hace una copia de sus datos y los procesa internamente. Para obtener información sobre cómo conceder acceso a su bucket de Amazon S3, consulte Concesión de acceso a los recursos de Amazon S3 para Amazon Personalize.

Si ya ha creado un recomendador o ha implementado una versión de solución personalizada con una campaña, la forma en que los nuevos registros masivos influyen en las recomendaciones depende del caso de uso del dominio o de la receta que utilice. Para obtener más información, consulta Influencia de los nuevos datos en las recomendaciones en tiempo real.

importante

De forma predeterminada, un trabajo de importación de conjuntos de datos reemplaza cualquier dato existente en el conjunto de datos que haya importado de manera masiva. Para agregar nuevos registros sin reemplazar los datos existentes, especifique INCREMENTAL para el modo de importación de la CreateDatasetImportJob operación.

Status

Un trabajo de importación del conjunto de datos puede aparecer en uno de los siguientes estados:

  • CREATE PENDING (CREACIÓN PENDIENTE) > CREATE IN_PROGRESS (CREACIÓN EN CURSO) > ACTIVE (ACTIVO) o CREATE FAILED (ERROR AL CREAR)

Para obtener el estado del trabajo de importación DescribeDatasetImportJob, llama e indica el nombre de recurso de Amazon (ARN) del trabajo de importación del conjunto de datos. La importación del conjunto de datos finaliza cuando el estado es ACTIVO. Si el estado muestra CREATE FAILED, la respuesta incluye una clave failureReason que describe el motivo del error en el trabajo.

nota

La importación lleva tiempo. Deberá esperar hasta que el estado pase a ACTIVE antes de entrenar un modelo con el conjunto de datos.

Sintaxis de la solicitud

{ "datasetArn": "string", "dataSource": { "dataLocation": "string" }, "importMode": "string", "jobName": "string", "publishAttributionMetricsToS3": boolean, "roleArn": "string", "tags": [ { "tagKey": "string", "tagValue": "string" } ] }

Parámetros de la solicitud

La solicitud acepta los siguientes datos en formato JSON.

datasetArn

El ARN del conjunto de datos que recibe los datos importados.

Tipo: cadena

Limitaciones de longitud: longitud máxima de 256.

Patrón: arn:([a-z\d-]+):personalize:.*:.*:.+

Obligatorio: sí

dataSource

El bucket de Amazon S3 que contiene los datos de entrenamiento que se importarán.

Tipo: objeto DataSource

Obligatorio: sí

importMode

Especifique cómo agregar los nuevos registros a un conjunto de datos existente. El modo de importación predeterminado es FULL. Si no ha importado registros masivos al conjunto de datos anteriormente, solo puede especificar FULL.

  • Especifique FULL para que se sobrescriban todos los datos masivos existentes en el conjunto de datos. Los datos que ha importado individualmente no se reemplazan.

  • Especifique INCREMENTAL si desea anexar los nuevos registros a los datos existentes en su conjunto de datos. Amazon Personalize reemplaza cualquier registro con el mismo identificador por el nuevo.

Tipo: cadena

Valores válidos: FULL | INCREMENTAL

Obligatorio: no

jobName

Nombre para el trabajo de importación del conjunto de datos.

Tipo: string

Limitaciones de longitud: longitud mínima de 1. La longitud máxima es de 63.

Patrón: ^[a-zA-Z0-9][a-zA-Z0-9\-_]*

Obligatorio: sí

publishAttributionMetricsToS3

Si ha creado una atribución de métricas, especifique si desea publicar las métricas de este trabajo de importación en Amazon S3

Tipo: Booleano

Obligatorio: no

roleArn

El ARN del rol de IAM que tiene permisos de lectura del origen de datos de Amazon S3.

Tipo: cadena

Limitaciones de longitud: longitud máxima de 256.

Patrón: arn:([a-z\d-]+):iam::\d{12}:role/?[a-zA-Z_0-9+=,.@\-_/]+

Obligatorio: sí

tags

Lista de etiquetas que se aplican al trabajo de importación del conjunto de datos.

Tipo: matriz de objetos Tag

Miembros de la matriz: número mínimo de 0 artículos. La cantidad máxima es de 200 artículos.

Obligatorio: no

Sintaxis de la respuesta

{ "datasetImportJobArn": "string" }

Elementos de respuesta

Si la acción se realiza correctamente, el servicio devuelve una respuesta HTTP 200.

El servicio devuelve los datos siguientes en formato JSON.

datasetImportJobArn

El ARN del trabajo de importación del conjunto de datos.

Tipo: cadena

Limitaciones de longitud: longitud máxima de 256.

Patrón: arn:([a-z\d-]+):personalize:.*:.*:.+

Errores

InvalidInputException

Proporcione un valor válido para el campo o el parámetro.

Código de estado HTTP: 400

LimitExceededException

Se ha excedido el límite en el número de solicitudes por segundo.

Código de estado HTTP: 400

ResourceAlreadyExistsException

El recurso especificado ya existe.

Código de estado HTTP: 400

ResourceInUseException

El recurso especificado está en uso.

Código de estado HTTP: 400

ResourceNotFoundException

No se ha encontrado el recurso especificado.

Código de estado HTTP: 400

TooManyTagsException

Ha superado el número máximo de etiquetas que puede aplicar a este recurso.

Código de estado HTTP: 400

Véase también

Para obtener más información sobre el uso de esta API en uno de los AWS SDK específicos del idioma, consulta lo siguiente: