Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
CreateDatasetImportJob
Crea un trabajo que importa datos de entrenamiento de un origen de datos (bucket de Amazon S3) a un conjunto de datos de Amazon Personalize. Para permitir que Amazon Personalize importe los datos de entrenamiento, debe especificar un rol de servicio de IAM que tenga permiso para leer el origen de datos, ya que Amazon Personalize hace una copia de sus datos y los procesa internamente. Para obtener información sobre cómo conceder acceso a su bucket de Amazon S3, consulte Concesión de acceso a los recursos de Amazon S3 para Amazon Personalize.
Si ya ha creado un recomendador o ha implementado una versión de solución personalizada con una campaña, la forma en que los nuevos registros masivos influyen en las recomendaciones depende del caso de uso del dominio o de la receta que utilice. Para obtener más información, consulta Influencia de los nuevos datos en las recomendaciones en tiempo real.
importante
De forma predeterminada, un trabajo de importación de conjuntos de datos reemplaza cualquier dato existente en el conjunto de datos que haya importado de manera masiva. Para agregar nuevos registros sin reemplazar los datos existentes, especifique INCREMENTAL para el modo de importación de la CreateDatasetImportJob operación.
Status
Un trabajo de importación del conjunto de datos puede aparecer en uno de los siguientes estados:
-
CREATE PENDING (CREACIÓN PENDIENTE) > CREATE IN_PROGRESS (CREACIÓN EN CURSO) > ACTIVE (ACTIVO) o CREATE FAILED (ERROR AL CREAR)
Para obtener el estado del trabajo de importación DescribeDatasetImportJob, llama e indica el nombre de recurso de Amazon (ARN) del trabajo de importación del conjunto de datos. La importación del conjunto de datos finaliza cuando el estado es ACTIVO. Si el estado muestra CREATE FAILED, la respuesta incluye una clave failureReason
que describe el motivo del error en el trabajo.
nota
La importación lleva tiempo. Deberá esperar hasta que el estado pase a ACTIVE antes de entrenar un modelo con el conjunto de datos.
API relacionadas
Sintaxis de la solicitud
{
"datasetArn": "string
",
"dataSource": {
"dataLocation": "string
"
},
"importMode": "string
",
"jobName": "string
",
"publishAttributionMetricsToS3": boolean
,
"roleArn": "string
",
"tags": [
{
"tagKey": "string
",
"tagValue": "string
"
}
]
}
Parámetros de la solicitud
La solicitud acepta los siguientes datos en formato JSON.
- datasetArn
-
El ARN del conjunto de datos que recibe los datos importados.
Tipo: cadena
Limitaciones de longitud: longitud máxima de 256.
Patrón:
arn:([a-z\d-]+):personalize:.*:.*:.+
Obligatorio: sí
- dataSource
-
El bucket de Amazon S3 que contiene los datos de entrenamiento que se importarán.
Tipo: objeto DataSource
Obligatorio: sí
- importMode
-
Especifique cómo agregar los nuevos registros a un conjunto de datos existente. El modo de importación predeterminado es
FULL
. Si no ha importado registros masivos al conjunto de datos anteriormente, solo puede especificarFULL
.-
Especifique
FULL
para que se sobrescriban todos los datos masivos existentes en el conjunto de datos. Los datos que ha importado individualmente no se reemplazan. -
Especifique
INCREMENTAL
si desea anexar los nuevos registros a los datos existentes en su conjunto de datos. Amazon Personalize reemplaza cualquier registro con el mismo identificador por el nuevo.
Tipo: cadena
Valores válidos:
FULL | INCREMENTAL
Obligatorio: no
-
- jobName
-
Nombre para el trabajo de importación del conjunto de datos.
Tipo: string
Limitaciones de longitud: longitud mínima de 1. La longitud máxima es de 63.
Patrón:
^[a-zA-Z0-9][a-zA-Z0-9\-_]*
Obligatorio: sí
- publishAttributionMetricsToS3
-
Si ha creado una atribución de métricas, especifique si desea publicar las métricas de este trabajo de importación en Amazon S3
Tipo: Booleano
Obligatorio: no
- roleArn
-
El ARN del rol de IAM que tiene permisos de lectura del origen de datos de Amazon S3.
Tipo: cadena
Limitaciones de longitud: longitud máxima de 256.
Patrón:
arn:([a-z\d-]+):iam::\d{12}:role/?[a-zA-Z_0-9+=,.@\-_/]+
Obligatorio: sí
-
Lista de etiquetas que se aplican al trabajo de importación del conjunto de datos.
Tipo: matriz de objetos Tag
Miembros de la matriz: número mínimo de 0 artículos. La cantidad máxima es de 200 artículos.
Obligatorio: no
Sintaxis de la respuesta
{
"datasetImportJobArn": "string"
}
Elementos de respuesta
Si la acción se realiza correctamente, el servicio devuelve una respuesta HTTP 200.
El servicio devuelve los datos siguientes en formato JSON.
- datasetImportJobArn
-
El ARN del trabajo de importación del conjunto de datos.
Tipo: cadena
Limitaciones de longitud: longitud máxima de 256.
Patrón:
arn:([a-z\d-]+):personalize:.*:.*:.+
Errores
- InvalidInputException
-
Proporcione un valor válido para el campo o el parámetro.
Código de estado HTTP: 400
- LimitExceededException
-
Se ha excedido el límite en el número de solicitudes por segundo.
Código de estado HTTP: 400
- ResourceAlreadyExistsException
-
El recurso especificado ya existe.
Código de estado HTTP: 400
- ResourceInUseException
-
El recurso especificado está en uso.
Código de estado HTTP: 400
- ResourceNotFoundException
-
No se ha encontrado el recurso especificado.
Código de estado HTTP: 400
- TooManyTagsException
-
Ha superado el número máximo de etiquetas que puede aplicar a este recurso.
Código de estado HTTP: 400
Véase también
Para obtener más información sobre el uso de esta API en uno de los AWS SDK específicos del idioma, consulta lo siguiente: