CreateDatasetImportJob - Amazon Forecast

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

CreateDatasetImportJob

Importa sus datos de entrenamiento a un conjunto de datos de Amazon Forecast. Proporcione la ubicación de los datos de entrenamiento en un bucket de Amazon Simple Storage Service (Amazon S3) y el Nombre de recurso de Amazon (ARN) del conjunto de datos al que desea importar los datos.

Debe especificar un DataSourceobjeto que incluya una función AWS Identity and Access Management (IAM) que Amazon Forecast pueda asumir para acceder a los datos, ya que Amazon Forecast hace una copia de sus datos y los procesa en un AWS sistema interno. Para obtener más información, consulte Configuración de permisos.

Los datos de entrenamiento deben estar en formato CSV o Parquet. El delimitador debe ser una coma (,).

Puede especificar la ruta a un archivo específico, el bucket de S3, o a una carpeta en el bucket de S3. En los dos últimos casos, Amazon Forecast importa todos los archivos hasta un límite de 10 000 archivos.

Como las importaciones de conjuntos de datos no se agregan, la importación de conjuntos de datos más reciente es la que se utiliza para entrenar al predictor o generar una previsión. Asegúrese de que la importación más reciente contenga todos los datos que desee utilizar para el modelado y no solo los datos nuevos que se recopilaron desde la importación anterior.

Para obtener una lista de todos sus trabajos de importación de conjuntos de datos, filtrados según criterios específicos, utilice la ListDatasetImportJobsoperación.

Sintaxis de la solicitud

{ "DatasetArn": "string", "DatasetImportJobName": "string", "DataSource": { "S3Config": { "KMSKeyArn": "string", "Path": "string", "RoleArn": "string" } }, "Format": "string", "GeolocationFormat": "string", "ImportMode": "string", "Tags": [ { "Key": "string", "Value": "string" } ], "TimestampFormat": "string", "TimeZone": "string", "UseGeolocationForTimeZone": boolean }

Parámetros de la solicitud

La solicitud acepta los siguientes datos en formato JSON.

DatasetArn

El Nombre de recurso de Amazon (ARN) del conjunto de datos de Amazon Forecast al que desea importar datos.

Tipo: cadena

Limitaciones de longitud: longitud máxima de 256.

Patrón: arn:([a-z\d-]+):forecast:.*:.*:.+

Obligatorio: sí

DatasetImportJobName

El nombre para el trabajo de importación del conjunto de datos. Recomendamos incluir la marca temporal actual en el nombre, por ejemplo, 20190721DatasetImport. Esto puede ayudarle a evitar que se produzca una excepción de ResourceAlreadyExistsException.

Tipo: string

Limitaciones de longitud: longitud mínima de 1. La longitud máxima es de 63.

Patrón: ^[a-zA-Z][a-zA-Z0-9_]*

Obligatorio: sí

DataSource

La ubicación de los datos de entrenamiento que se van a importar y una función AWS Identity and Access Management (IAM) que Amazon Forecast puede asumir para acceder a los datos. Los datos de entrenamiento tienen que estar almacenados en un bucket de Amazon S3.

Si se utiliza el cifrado, DataSource debe incluir una clave AWS Key Management Service (KMS) y el rol de IAM debe permitir a Amazon Forecast acceder a la clave. La clave de KMS y la función de IAM deben coincidir con las especificadas en el EncryptionConfig parámetro de la CreateDatasetoperación.

Tipo: objeto DataSource

Obligatorio: sí

Format

El formato de los datos importados, CSV o PARQUET. El valor predeterminado es CSV.

Tipo: cadena

Limitaciones de longitud: longitud máxima de 7.

Patrón: ^CSV|PARQUET$

Obligatorio: no

GeolocationFormat

El formato del atributo de geolocalización. Al atributo de geolocalización se le puede dar formato de dos maneras:

  • LAT_LONG: la latitud y la longitud en formato decimal (ejemplo: 47,61_-122,33).

  • CC_POSTALCODE (Solo EE.UU.): el código de país (US) seguido del código postal de 5 dígitos (ejemplo: US_98121).

Tipo: cadena

Limitaciones de longitud: longitud máxima de 256.

Patrón: ^[a-zA-Z0-9_]+$

Obligatorio: no

ImportMode

Especifica si el trabajo de importación del conjunto de datos es una importación FULL o INCREMENTAL. Una importación de conjunto de datos de FULL reemplaza todos los datos existentes por los datos recién importados. Una importación de INCREMENTAL añade los datos importados a los datos existentes.

Tipo: cadena

Valores válidos: FULL | INCREMENTAL

Obligatorio: no

Tags

Los metadatos opcionales que se aplican al trabajo de importación del conjunto de datos para ayudarle a categorizarlos y organizarlos. Cada etiqueta está formada por una clave y un valor opcional, ambos definidos por el usuario.

Se aplican las siguientes restricciones básicas a las etiquetas:

  • Número máximo de etiquetas por recurso: 50.

  • Para cada recurso, cada clave de etiqueta debe ser única y solo puede tener un valor.

  • Longitud máxima de la clave: 128 caracteres Unicode en UTF-8

  • Longitud máxima del valor: 256 caracteres Unicode en UTF-8

  • Si se utiliza su esquema de etiquetado en múltiples servicios y recursos, recuerde que otros servicios pueden tener otras restricciones sobre caracteres permitidos. Los caracteres permitidos generalmente son: letras, números y espacios representables en UTF-8, además de los siguientes caracteres: + - = . _ : / @.

  • Las claves y los valores de las etiquetas distinguen entre mayúsculas y minúsculas.

  • No utilice aws:AWS:, ni ninguna combinación de mayúsculas o minúsculas, como prefijo para las teclas, ya que está reservado para su uso. AWS Las claves de etiquetas que tienen este prefijo no se pueden editar ni eliminar. Los valores pueden tener este prefijo. Si el valor de una etiqueta tiene aws como prefijo pero la clave no, Forecast la considera una etiqueta de usuario y se contabilizará en el límite de 50 etiquetas. Las etiquetas que tengan solo el prefijo de clave de aws no cuentan para el límite de etiquetas por recurso.

Tipo: matriz de objetos Tag

Miembros de la matriz: número mínimo de 0 artículos. La cantidad máxima es de 200 artículos.

Obligatorio: no

TimestampFormat

El formato de las marcas temporales del conjunto de datos. El formato que especifique depende de la DataFrequency especificada cuando se creó el conjunto de datos. Se admiten los siguientes formatos:

  • “aaaa-MM-dd”

    Para las siguientes frecuencias de datos: Y (anual), M (mensual), W (semanal) y D (diaria)

  • "aaaa-MM-dd HH:mm:ss"

    Para las siguientes frecuencias de datos: H, 30 minutos, 15 minutos y 1 minuto; y opcionalmente, para: Y, M, W y D

Si no se especifica el formato, Amazon Forecast espera que sea “aaaa-MM-dd HH:mm:ss”.

Tipo: cadena

Limitaciones de longitud: longitud máxima de 256.

Patrón: ^[a-zA-Z0-9\-\:\.\,\'\s]+$

Obligatorio: no

TimeZone

Una zona horaria única para cada artículo del conjunto de datos. Esta opción es ideal para conjuntos de datos con todas las marcas temporales dentro de una sola zona horaria, o si todas las marcas temporales están normalizadas en una sola zona horaria.

Consulte la API de Joda-Time para obtener una lista completa de los nombres de zonas horarias válidos.

Tipo: cadena

Limitaciones de longitud: longitud máxima de 256.

Patrón: ^[a-zA-Z0-9\/\+\-\_]+$

Obligatorio: no

UseGeolocationForTimeZone

Obtenga automáticamente la información de la zona horaria a partir del atributo de geolocalización. Esta opción es ideal para conjuntos de datos que contienen marcas temporales en varias zonas horarias y si esas marcas temporales se expresan en hora local.

Tipo: Booleano

Obligatorio: no

Sintaxis de la respuesta

{ "DatasetImportJobArn": "string" }

Elementos de respuesta

Si la acción se realiza correctamente, el servicio devuelve una respuesta HTTP 200.

El servicio devuelve los datos siguientes en formato JSON.

DatasetImportJobArn

El nombre de recurso de Amazon (ARN) del trabajo de importación del conjunto de datos.

Tipo: cadena

Limitaciones de longitud: longitud máxima de 256.

Patrón: arn:([a-z\d-]+):forecast:.*:.*:.+

Errores

InvalidInputException

No podemos procesar la solicitud porque incluye un valor no válido o un valor que supera el rango válido.

Código de estado HTTP: 400

LimitExceededException

Se ha superado el límite en el número de recursos por cuenta.

Código de estado HTTP: 400

ResourceAlreadyExistsException

Ya existe un recurso con este nombre. Inténtelo de nuevo con un nombre diferente.

Código de estado HTTP: 400

ResourceInUseException

El recurso especificado está en uso.

Código de estado HTTP: 400

ResourceNotFoundException

No podemos encontrar un recurso con ese nombre de recurso de Amazon (ARN). Compruebe el ARN e inténtelo de nuevo.

Código de estado HTTP: 400

Véase también

Para obtener más información sobre el uso de esta API en uno de los AWS SDK específicos del idioma, consulta lo siguiente: