CreateDatasetImportJob - Amazon Forecast

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

CreateDatasetImportJob

Importe vos données d'entraînement dans un ensemble de données Amazon Forecast. Vous indiquez l'emplacement de vos données d'entraînement dans un bucket Amazon Simple Storage Service (Amazon S3) ainsi que le nom de ressource Amazon (ARN) de l'ensemble de données dans lequel vous souhaitez importer les données.

Vous devez spécifier un DataSourceobjet qui inclut un rôle AWS Identity and Access Management (IAM) qu'Amazon Forecast peut assumer pour accéder aux données, car Amazon Forecast crée une copie de vos données et les traite dans un AWS système interne. Pour plus d'informations, consultez la section Configurer les autorisations.

Les données d'entraînement doivent être au format CSV ou Parquet. Le délimiteur doit être une virgule (,).

Vous pouvez spécifier le chemin d'accès à un fichier spécifique, au compartiment S3 ou à un dossier du compartiment S3. Dans les deux derniers cas, Amazon Forecast importe tous les fichiers dans la limite de 10 000 fichiers.

Comme les importations de jeux de données ne sont pas agrégées, votre importation de jeu de données la plus récente est celle qui est utilisée lors de l'entraînement d'un prédicteur ou de la génération d'une prévision. Assurez-vous que votre dernier jeu de données importé contient toutes les données à partir desquelles vous souhaitez modéliser, et pas uniquement les nouvelles données collectées depuis l'importation précédente.

Pour obtenir une liste de toutes vos tâches d'importation de jeux de données, filtrées selon des critères spécifiques, utilisez l'ListDatasetImportJobsopération.

Syntaxe de la requête

{ "DatasetArn": "string", "DatasetImportJobName": "string", "DataSource": { "S3Config": { "KMSKeyArn": "string", "Path": "string", "RoleArn": "string" } }, "Format": "string", "GeolocationFormat": "string", "ImportMode": "string", "Tags": [ { "Key": "string", "Value": "string" } ], "TimestampFormat": "string", "TimeZone": "string", "UseGeolocationForTimeZone": boolean }

Paramètres de demande

Cette demande accepte les données suivantes au format JSON.

DatasetArn

Le nom de ressource Amazon (ARN) du jeu de données Amazon Forecast dans lequel vous souhaitez importer des données.

Type : chaîne

Contraintes de longueur : longueur maximale de 256.

Modèle : arn:([a-z\d-]+):forecast:.*:.*:.+

Obligatoire : oui

DatasetImportJobName

Nom de la tâche d'importation de l'ensemble de données. Nous recommandons d'inclure l'horodatage actuel dans le nom, par exemple,. 20190721DatasetImport Cela peut vous aider à éviter une ResourceAlreadyExistsException exception.

Type : chaîne

Contraintes de longueur : longueur minimum de 1. Longueur maximum de 63.

Modèle : ^[a-zA-Z][a-zA-Z0-9_]*

Obligatoire : oui

DataSource

L'emplacement des données d'entraînement à importer et le rôle AWS Identity and Access Management (IAM) qu'Amazon Forecast peut assumer pour accéder aux données. Les données d'entraînement doivent être stockées dans un compartiment Amazon S3.

Si le chiffrement est utilisé, DataSource il doit inclure une clé AWS Key Management Service (KMS) et le rôle IAM doit autoriser Amazon Forecast à accéder à la clé. La clé KMS et le rôle IAM doivent correspondre à ceux spécifiés dans le EncryptionConfig paramètre de l'CreateDatasetopération.

Type : objet DataSource

Obligatoire : oui

Format

Le format des données importées, CSV ou PARQUET. La valeur par défaut est CSV.

Type : chaîne

Contraintes de longueur : longueur maximale de 7.

Modèle : ^CSV|PARQUET$

Obligatoire : non

GeolocationFormat

Format de l'attribut de géolocalisation. L'attribut de géolocalisation peut être formaté de deux manières différentes :

  • LAT_LONG- la latitude et la longitude au format décimal (exemple : 47.61_-122.33).

  • CC_POSTALCODE(États-Unis uniquement) : le code du pays (États-Unis), suivi du code postal à 5 chiffres (exemple : US_98121).

Type : chaîne

Contraintes de longueur : longueur maximale de 256.

Modèle : ^[a-zA-Z0-9_]+$

Obligatoire : non

ImportMode

Spécifie si la tâche d'importation de l'ensemble de données est une tâche FULL ou une INCREMENTAL importation. L'importation d'un FULL jeu de données remplace toutes les données existantes par les données nouvellement importées. Une INCREMENTAL importation ajoute les données importées aux données existantes.

Type : chaîne

Valeurs valides : FULL | INCREMENTAL

Obligatoire : non

Tags

Les métadonnées facultatives que vous appliquez à la tâche d'importation du jeu de données pour vous aider à les classer et à les organiser. Chaque balise est constituée d’une clé et d’une valeur facultative que vous définissez.

Les restrictions de base suivantes s’appliquent aux balises :

  • Nombre maximum de balises par ressource : 50.

  • Pour chaque ressource, chaque clé d'identification doit être unique, et chaque clé d'identification peut avoir une seule valeur.

  • Longueur de clé maximale : 128 caractères Unicode en UTF-8.

  • Longueur maximale de la valeur : 256 caractères Unicode en UTF-8.

  • Si votre schéma d'identification est utilisé pour plusieurs services et ressources, n'oubliez pas que d'autres services peuvent avoir des restrictions concernant les caractères autorisés. Les caractères généralement autorisés sont les lettres, les chiffres et les espaces représentables en UTF-8, ainsi que les caractères suivants : + - = . _ : / @.

  • Les clés et valeurs de balise sont sensibles à la casse.

  • N'utilisez pas aws:AWS:, ni aucune combinaison majuscules ou minuscules, comme un préfixe pour les clés, car il est réservé à l'usage. AWS Vous ne pouvez pas modifier ou supprimer les clés de balise avec ce préfixe. Les valeurs peuvent avoir ce préfixe. Si une valeur de balise a aws pour préfixe, mais pas la clé, Forecast considère qu'il s'agit d'une balise utilisateur et compte dans la limite de 50 balises. Les balises dont le seul préfixe est « ne sont pas prises en compte dans aws le calcul de vos balises par limite de ressources ».

Type : tableau d’objets Tag

Membres du tableau : nombre minimum de 0 élément. Nombre maximum de 200 éléments.

Obligatoire : non

TimestampFormat

Format des horodatages dans le jeu de données. Le format que vous spécifiez dépend du moment où le DataFrequency jeu de données a été créé. Les formats suivants sont pris en charge

  • « YYYY-MM-DD »

    Pour les fréquences de données suivantes : Y, M, W et D

  • "aaaa-MM-jj HH:mm:ss"

    Pour les fréquences de données suivantes : H, 30 min, 15 min et 1 min ; et éventuellement, pour : Y, M, W et D

Si le format n'est pas spécifié, Amazon Forecast s'attend à ce que le format soit « yyyy-MM-DD HH:MM:ss ».

Type : chaîne

Contraintes de longueur : longueur maximale de 256.

Modèle : ^[a-zA-Z0-9\-\:\.\,\'\s]+$

Obligatoire : non

TimeZone

Un seul fuseau horaire pour chaque élément de votre jeu de données. Cette option est idéale pour les ensembles de données dont tous les horodatages se situent dans un même fuseau horaire, ou si tous les horodatages sont normalisés sur un seul fuseau horaire.

Reportez-vous à l'API Joda-Time pour obtenir la liste complète des noms de fuseaux horaires valides.

Type : chaîne

Contraintes de longueur : longueur maximale de 256.

Modèle : ^[a-zA-Z0-9\/\+\-\_]+$

Obligatoire : non

UseGeolocationForTimeZone

Dérivez automatiquement les informations de fuseau horaire à partir de l'attribut de géolocalisation. Cette option est idéale pour les ensembles de données contenant des horodatages dans plusieurs fuseaux horaires et ces horodatages sont exprimés en heure locale.

Type : booléen

Obligatoire : non

Syntaxe de la réponse

{ "DatasetImportJobArn": "string" }

Eléments de réponse

Si l’action aboutit, le service renvoie une réponse HTTP 200.

Les données suivantes sont renvoyées au format JSON par le service.

DatasetImportJobArn

Le nom de ressource Amazon (ARN) de la tâche d'importation de l'ensemble de données.

Type : chaîne

Contraintes de longueur : longueur maximale de 256.

Modèle : arn:([a-z\d-]+):forecast:.*:.*:.+

Erreurs

InvalidInputException

Nous ne pouvons pas traiter la demande car elle contient une valeur non valide ou une valeur qui dépasse la plage valide.

Code d’état HTTP : 400

LimitExceededException

La limite du nombre de ressources par compte a été dépassée.

Code d’état HTTP : 400

ResourceAlreadyExistsException

Il existe déjà une ressource portant ce nom. Réessayez avec un autre nom.

Code d’état HTTP : 400

ResourceInUseException

La ressource spécifiée est en cours d'utilisation.

Code d’état HTTP : 400

ResourceNotFoundException

Nous ne trouvons aucune ressource portant ce nom de ressource Amazon (ARN). Vérifiez l'ARN et réessayez.

Code d’état HTTP : 400

consultez aussi

Pour plus d'informations sur l'utilisation de cette API dans l'un des AWS SDK spécifiques au langage, consultez les pages suivantes :