CreateDataset - Amazon Forecast

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

CreateDataset

Crée un jeu de données Amazon Forecast. Les informations relatives au jeu de données de données que vous fournissez aident Forecast à comprendre comment utiliser les données pour l'entraînement de modèle. Cela inclut les éléments suivants :

  • DataFrequency  : la fréquence à laquelle vos données de séries temporelles historiques sont collectées.

  • Domain et DatasetType  : chaque jeu de données possède un domaine de jeu de données associé et un type au sein du domaine. Amazon Forecast fournit une liste de domaines et de types prédéfinis au sein de chaque domaine. Pour chaque domaine et type de jeu de données unique au sein du domaine, Amazon Forecast nécessite que vos données incluent un ensemble minimal de champs prédéfinis.

  • Schema  : un schéma spécifie les champs du jeu de données, y compris le nom du champ et le type de données.

Après avoir créé un jeu de données, vous y importez vos données d'entraînement et ajoutez le jeu de données à un groupe de jeux de données. Vous utilisez le groupe de jeux de données pour créer un prédicteur. Pour plus d'informations, veuillez consulter la rubrique Importation de jeux de données.

Pour obtenir la liste de tous vos ensembles de données, utilisez l'ListDatasetsopération.

Par exemple, les ensembles de données Forecast, consultez le GitHubréférentiel Amazon Forecast Sample.

Note

Le paramètre Status d'un ensemble de données doit avoir la valeur ACTIVE pour rendre possible l'importation de données de formation. Utilisez l'opération DescribeDataset pour obtenir le statut.

Syntaxe de la requête

{ "DataFrequency": "string", "DatasetName": "string", "DatasetType": "string", "Domain": "string", "EncryptionConfig": { "KMSKeyArn": "string", "RoleArn": "string" }, "Schema": { "Attributes": [ { "AttributeName": "string", "AttributeType": "string" } ] }, "Tags": [ { "Key": "string", "Value": "string" } ] }

Paramètres de demande

Cette demande accepte les données suivantes au format JSON.

DataFrequency

La fréquence de collecte des données. Ce paramètre est obligatoire pour les jeux de données RELATED_TIME_SERIES.

Les intervalles valides sont un nombre entier suivi de Y (année), M (mois), W (semaine), D (jour), H (heure) et min (minute). Par exemple, « 1D » indique tous les jours et « 15min » indique toutes les 15 minutes. Vous ne pouvez pas spécifier une valeur qui chevaucherait la fréquence supérieure suivante. Cela signifie, par exemple, que vous ne pouvez pas spécifier une fréquence de 60 minutes, car cela équivaut à 1 heure. Les valeurs valides pour chaque fréquence sont les suivantes :

  • Minute : 1 à 59

  • Heure : 1 à 23

  • Jour : 1 à 6

  • Semaine : 1 à 4

  • Mois : 1 à 11

  • Année : 1

Ainsi, si vous souhaitez des prévisions toutes les deux semaines, spécifiez « 2W ». Ou, si vous souhaitez des prévisions trimestrielles, spécifiez « 3M ».

Type : chaîne

Contraintes de longueur : longueur minimum de 1. Longueur maximale de 5.

Modèle : ^Y|M|W|D|H|30min|15min|10min|5min|1min$

Obligatoire : non

DatasetName

Nom du jeu de données.

Type : chaîne

Contraintes de longueur : longueur minimum de 1. Longueur maximum de 63.

Modèle : ^[a-zA-Z][a-zA-Z0-9_]*

Obligatoire : oui

DatasetType

Le type de jeu de données. Les valeurs valides dépendent de la valeur choisieDomain.

Type : chaîne

Valeurs valides : TARGET_TIME_SERIES | RELATED_TIME_SERIES | ITEM_METADATA

Obligatoire : oui

Domain

Le domaine associé au jeu de données. Lorsque vous ajoutez un ensemble de données à un groupe de jeux de données, cette valeur et celle spécifiée pour le Domain paramètre de l'CreateDatasetGroupopération doivent correspondre.

Les Domain et DatasetType que vous choisissez déterminent les champs qui doivent être présents dans les données d'entraînement que vous importez dans le jeu de données. Par exemple, si vous choisissez le RETAIL domaine et TARGET_TIME_SERIES comme telsDatasetType, Amazon Forecast exige item_idtimestamp, et demand les champs devant figurer dans vos données. Pour plus d'informations, veuillez consulter la rubrique Importation de jeux de données.

Type : chaîne

Valeurs valides : RETAIL | CUSTOM | INVENTORY_PLANNING | EC2_CAPACITY | WORK_FORCE | WEB_TRAFFIC | METRICS

Obligatoire : oui

EncryptionConfig

Une clé AWS Key Management Service (KMS) et le rôle AWS Identity and Access Management (IAM) qu'Amazon Forecast peut assumer pour accéder à la clé.

Type : objet EncryptionConfig

Obligatoire : non

Schema

Le schéma du jeu de données. Les attributs du schéma et leur ordre doivent correspondre aux champs de vos données. Les jeux de données Domain et DatasetType que vous choisissez déterminent les champs obligatoires minimaux dans vos données d'entraînement. Pour plus d'informations sur les champs obligatoires pour un domaine et un type de jeu de données spécifiques, veuillez consulter la rubrique Domaines de jeux de données et types de jeux de données.

Type : objet Schema

Obligatoire : oui

Tags

Les métadonnées facultatives que vous appliquez au jeu de données pour vous aider à les classer et à les organiser. Chaque balise est constituée d’une clé et d’une valeur facultative que vous définissez.

Les restrictions de base suivantes s’appliquent aux balises :

  • Nombre maximum de balises par ressource : 50.

  • Pour chaque ressource, chaque clé d'identification doit être unique, et chaque clé d'identification peut avoir une seule valeur.

  • Longueur de clé maximale : 128 caractères Unicode en UTF-8.

  • Longueur maximale de la valeur : 256 caractères Unicode en UTF-8.

  • Si votre schéma d'identification est utilisé pour plusieurs services et ressources, n'oubliez pas que d'autres services peuvent avoir des restrictions concernant les caractères autorisés. Les caractères généralement autorisés sont les lettres, les chiffres et les espaces représentables en UTF-8, ainsi que les caractères suivants : + - = . _ : / @.

  • Les clés et valeurs de balise sont sensibles à la casse.

  • N'utilisez pas aws:AWS:, ni aucune combinaison majuscules ou minuscules, comme un préfixe pour les clés, car il est réservé à l'usage. AWS Vous ne pouvez pas modifier ou supprimer les clés de balise avec ce préfixe. Les valeurs peuvent avoir ce préfixe. Si une valeur de balise a aws pour préfixe, mais pas la clé, Forecast considère qu'il s'agit d'une balise utilisateur et compte dans la limite de 50 balises. Les balises dont le seul préfixe est « ne sont pas prises en compte dans aws le calcul de vos balises par limite de ressources ».

Type : tableau d’objets Tag

Membres du tableau : nombre minimum de 0 élément. Nombre maximum de 200 éléments.

Obligatoire : non

Syntaxe de la réponse

{ "DatasetArn": "string" }

Eléments de réponse

Si l’action aboutit, le service renvoie une réponse HTTP 200.

Les données suivantes sont renvoyées au format JSON par le service.

DatasetArn

L'Amazon Resource Name (ARN) du jeu de données.

Type : chaîne

Contraintes de longueur : longueur maximale de 256.

Modèle : arn:([a-z\d-]+):forecast:.*:.*:.+

Erreurs

InvalidInputException

Nous ne pouvons pas traiter la demande car elle contient une valeur non valide ou une valeur qui dépasse la plage valide.

Code d’état HTTP : 400

LimitExceededException

La limite du nombre de ressources par compte a été dépassée.

Code d’état HTTP : 400

ResourceAlreadyExistsException

Il existe déjà une ressource portant ce nom. Réessayez avec un autre nom.

Code d’état HTTP : 400

consultez aussi

Pour plus d’informations sur l’utilisation de cette API dans l’un des kits SDK AWS spécifiques au langage, consultez les ressources suivantes :