Domaines et types d'ensembles de données prédéfinis - Amazon Forecast

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Domaines et types d'ensembles de données prédéfinis

Pour former un prédicteur, vous créez un ou plusieurs ensembles de données, vous les ajoutez à un groupe que vous fournissez pour la formation.

Pour chaque ensemble de données que vous créez, vous associez un domaine et un type d'ensemble de données. Un domaine d'ensemble de données spécifie un schéma d’ensemble de données prédéfini pour un cas d'utilisation courant et n'a pas d'impact sur les algorithmes ou les hyperparamètres de modèle.

Amazon Forecast prend en charge les domaines d'ensembles de données suivants :

Chaque domaine peut avoir un à trois types d'ensemble de données. Les types d'ensemble de données que vous créez pour un domaine sont basés sur le type de données dont vous disposez et que vous souhaitez inclure dans la formation.

Chaque domaine nécessite un ensemble de données TARGET_TIME_SERIES et peut prendre en charge les types d'ensembles de données RELATED_TIME_SERIES et ITEM_METADATA.

Les types d'ensemble de données sont les suivants :

  • Série chronologique cible : seul type de jeu de données requis. Ce type définit le champ cible pour lequel vous souhaitez générer des prévisions. Par exemple, si vous souhaitez prévoir les ventes sur un ensemble de produits, vous devez créer un ensemble de données de séries chronologiques historiques pour chacun des produits que vous souhaitez prévoir. De même, vous pouvez créer un jeu de données de séries chronologiques cible pour les indicateurs, tels que le chiffre d'affaires, le flux de trésorerie et les ventes, que vous souhaiterez peut-être prévoir.

  • Séries chronologiques associées : données de séries chronologiques liées aux données de séries chronologiques cibles. Par exemple, un prix lié aux données de vente d'un produit peut être fourni en tant que données RELATED_TIME_SERIES.

  • Métadonnées de l'élément : métadonnées applicables aux données de séries chronologiques cibles. Par exemple, si vous prévoyez les ventes d'un produit en particulier, les attributs du produit, tels que la marque, la couleur et le genre, feront partie des métadonnées de l'article. Lors de la prévision de capacité pour les instances EC2, les métadonnées peuvent inclure l'UC et la mémoire des types d'instances.

Certains champs sont obligatoires pour vos données d'entrée et ce pour chaque type d'ensembles de données. Vous pouvez également inclure des champs facultatifs qu'Amazon Forecast vous propose.

Les exemples suivants montrent comment choisir un domaine d'ensembles de données et les types correspondants.

Exemple 1 : Types d'ensembles de données dans le domaine RETAIL

Si vous êtes un détaillant intéressé par la prévision de la demande pour certains articles, vous pouvez créer les ensembles de données suivants dans le domaine RETAIL :

  • La série chronologique cible est l'ensemble de données requis basé sur les données historiques et chronologiques (ventes) pour chaque article (chaque produit que vend un détaillant). Dans le domaine RETAIL, ce type d'ensembles de données doit inclure le item_id, timestamp, et les champs demand. Le champ demand est la cible de la prévision, c'est généralement le nombre d'articles vendus par le détaillant sur une semaine ou un jour particulier.

  • Il peut s'agir d'un ensemble de données du type RELATED_TIME_SERIES. Dans le domaine RETAIL, ce type peut inclure de façon facultative mais suggérée, des informations de séries chronologiques telles que price, inventory_onhand et webpage_hits.

  • Il peut également s'agir d'un ensemble de données du type ITEM_METADATA. Dans le domaine RETAIL, Amazon Forecast suggère de fournir des informations de métadonnées concernant les articles que vous avez fournis dans TARGET_TIME_SERIES, telles que brand, color, category, et genre.

Exemple 2 : Types d'ensembles de données dans le domaine METRICS

Si vous souhaitez prévoir des indicateurs clés pour votre entreprise, tels que le chiffre d'affaires, les ventes et les flux de trésorerie, vous pouvez fournir à Amazon Forecast les ensembles de données suivants :

  • Ensemble de données TARGET_TIME_SERIES qui fournit les données en séries chronologiques historiques pour la métrique que vous souhaitez prévoir. Si votre métrique a pour but de prévoir les recettes de toutes les unités commerciales de votre organisation, vous pouvez créer un ensemble de données target time series avec les champs metric, business unit et metric_value.

  • Si vous avez des métadonnées pour chaque métrique qui n'est pas obligatoire, comme category ou location, vous pouvez fournir des ensembles de données du type RELATED_TIME_SERIES et ITEM_METADATA.

Vous devez au minimum fournir un jeu de données de séries chronologiques cible pour Forecast afin de générer des prévisions pour vos mesures cibles.

Exemple 3 : Types d'ensembles de données dans le domaine CUSTOM

Il peut arriver que les données de formation de votre application de prévisions ne conviennent pas à l'un des domaines d'Amazon Forecast. Si c'est le cas, choisissez le domaine CUSTOM. Vous devez fournir l'ensemble de données TARGET_TIME_SERIES, mais vous pouvez aussi ajouter vos propres champs personnalisés.

L'exercice Démarrerprévoit la consommation d'électricité pour un client. Les données de formation concernant la consommation d'électricité ne correspondent à aucun des domaines, par conséquent nous avons utilisé le domaine CUSTOM. Dans l'exercice, nous n'utilisons qu'un type d'ensemble de données, le type TARGET_TIME_SERIES. Nous mappons les champs de données aux champs minimum requis par le type d'ensemble de données.