Algorithme CNN-QR - Amazon Forecast

Amazon Forecast n'est plus disponible pour les nouveaux clients. Les clients existants d'Amazon Forecast peuvent continuer à utiliser le service normalement. En savoir plus »

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Algorithme CNN-QR

Amazon Forecast Forecasting CNN-QR, Convolutional Neural Network - Quantile Regression, est un algorithme d'apprentissage automatique propriétaire pour les prédictions de séries temporelles scalaires (unidimensionnelles) à l'aide de réseaux neuronaux convolutifs (CNN) causaux. Cet algorithme d'apprentissage supervisé entraîne un modèle global à partir d'une vaste collection de séries chronologiques et utilise un décodeur quantile pour effectuer des prédictions probabilistes.

Mise en route avec CNN-QR

Vous pouvez entraîner un prédicteur avec CNN-QR de deux manières :

  1. Sélection manuelle de l'algorithme CNN-QR.

  2. Choisir AutoML (CNN-QR fait partie d'AutoML).

Si vous ne savez pas quel algorithme utiliser, nous vous recommandons de sélectionner AutoML, et Forecast sélectionnera CNN-QR s'il s'agit de l'algorithme le plus précis pour vos données. Pour savoir si CNN-QR a été sélectionné comme modèle le plus précis, utilisez l'DescribePredictorAPI ou choisissez le nom du prédicteur dans la console.

Voici quelques cas d'utilisation clés de CNN-QR :

  • Forecast l'aide d'ensembles de données volumineux et complexes : CNN-QR fonctionne mieux lorsqu'il est formé avec des ensembles de données volumineux et complexes. Le réseau neuronal peut apprendre à travers de nombreux ensembles de données, ce qui est utile lorsque vous disposez de séries chronologiques et de métadonnées d'éléments connexes.

  • Prévisions avec séries chronologiques historiques connexes - CNN-QR n'exige pas que les séries chronologiques associées contiennent des points de données compris dans l'horizon de Forecast. Cette flexibilité accrue vous permet d'inclure un plus large éventail de séries chronologiques et de métadonnées d'articles connexes, telles que le prix des articles, les événements, les statistiques Web et les catégories de produits.

Comment fonctionne CNN-QR

CNN-QR est un modèle sequence-to-sequence (Seq2Seq) de prévision probabiliste qui teste dans quelle mesure une prédiction reconstruit la séquence de décodage, en fonction de la séquence de codage.

L'algorithme permet différentes fonctionnalités dans les séquences d'encodage et de décodage. Vous pouvez donc utiliser une série chronologique associée dans l'encodeur et l'omettre dans le décodeur (et vice versa). Par défaut, les séries chronologiques associées avec des points de données dans l'horizon de prévision seront incluses à la fois dans l'encodeur et dans le décodeur. Les séries chronologiques associées sans points de données dans l'horizon de prévision seront uniquement incluses dans l'encodeur.

CNN-QR effectue une régression quantile avec un CNN causal hiérarchique servant d'extracteur de caractéristiques apprenable.

Pour faciliter les modèles d'apprentissage dépendant du temps, tels que les pics pendant les week-ends, CNN-QR crée automatiquement des séries chronologiques de fonctionnalités basées sur la granularité des séries chronologiques. Par exemple, CNN-QR crée deux séries chronologiques de caractéristiques (day-of-month et day-of-year) à une fréquence hebdomadaire. L'algorithme utilise ces séries temporelles de caractéristiques dérivées avec les séries temporelles de caractéristiques personnalisées fournies au cours de l'entraînement et de l'inférence. L'exemple suivant montre une série chronologique cible et deux fonctionnalités dérivées de séries chronologiques :ui,1,t représente l'heure du jour etui,2,t représente le jour de la semaine.zi,t

Image : CNN-QR avec caractéristiques dérivées pour les fréquences temporelles.

CNN-QR inclut automatiquement ces séries chronologiques de fonctionnalités en fonction de la fréquence des données et de la taille des données d'entraînement. Le tableau suivant répertorie les fonctions qui peuvent être obtenues pour chaque fréquence de temps prise en charge.

Fréquence des séries chronologiques Caractéristiques dérivées
Minute minute-of-hour, hour-of-day, day-of-week, day-of-month, day-of-year
Heure hour-of-day, day-of-week, day-of-month, day-of-year
jour day-of-week, day-of-month, day-of-year
semaine week-of-month, week-of-year
Mois month-of-year

Pendant l'entraînement, chaque série chronologique du jeu de données d'entraînement se compose de deux fenêtres contextuelles et prévisionnelles adjacentes avec des longueurs prédéfinies fixes. Cela est illustré dans la figure ci-dessous, où la fenêtre contextuelle est représentée en vert et la fenêtre de prévision est représentée en bleu.

Vous pouvez utiliser un modèle formé sur un ensemble d'entraînement donné pour générer des prévisions pour les séries chronologiques de l'ensemble d'entraînement et pour d'autres séries chronologiques. L'ensemble de données d'apprentissage consiste en une série chronologique cible, qui peut être associée à une liste de séries chronologiques et de métadonnées d'éléments connexes.

La figure ci-dessous montre comment cela fonctionne pour un élément d'un jeu de données d'entraînement indexé pari. L'ensemble de données d'entraînement comprend une série chronologiquezi,t cible et deux séries chronologiques associées,xi,1,t etxi,2,t. La première série chronologique connexe est une série chronologique prospective, et la seconde est une série chronologique historique.xi,1,txi,2,t

Image : CNN-QR avec séries chronologiques historiques et prospectives

CNN-QR apprend à travers la série chronologique cible et les séries chronologiques associéesxi,1,t etxi,2,t, pour générer des prévisions dans la fenêtre de prévision, représentée par la ligne orange.zi,t

Utilisation de données connexes avec CNN-QR

Le CNNQR prend en charge les ensembles de données de séries chronologiques connexes historiques et prospectives. Si vous fournissez un jeu de données de séries chronologiques lié à l'avenir, toute valeur manquante sera remplie selon la méthode de remplissage future. Pour plus d'informations sur les séries chronologiques historiques et prospectives connexes, voir Utilisation d'ensembles de données de séries chronologiques connexes.

Vous pouvez également utiliser des ensembles de données de métadonnées d'articles avec CNN-QR. Il s'agit d'ensembles de données contenant des informations statiques sur les éléments de votre série chronologique cible. Les métadonnées des éléments sont particulièrement utiles pour les scénarios de prévision à froid dans lesquels il existe peu ou pas de données historiques. Pour plus d'informations sur les métadonnées des éléments, voir Métadonnées des éléments.

Hyperparamètres CNN-QR

Amazon Forecast optimise les modèles CNN-QR sur des hyperparamètres sélectionnés. Lorsque vous sélectionnez CNN-QR manuellement, vous avez la possibilité de transmettre des paramètres d'apprentissage pour ces hyperparamètres. Le tableau suivant répertorie les hyperparamètres réglables de l'algorithme CNN-QR.

Nom du paramètre Valeurs Description
context_length
Valeurs valides

Entiers positifs

Gamme valide

10 à 500

Valeurs typiques

2*ForecastHorizon à 12*ForecastHorizon

HPO personnalisable

Oui

Le nombre de points temporels que le modèle lit avant de faire des prédictions. En général, CNN-QR a des valeurs supérieures àcontext_length celles de DeepAr+, car CNN-QR n'utilise pas de décalage pour examiner d'autres données historiques.

Si la valeur pourcontext_length se situe en dehors d'une plage prédéfinie, CNN-QR définira automatiquement la valeur par défautcontext_length sur une valeur appropriée.

use_related_data
Valeurs valides

ALL

NONE

HISTORICAL

FORWARD_LOOKING

Valeur par défaut

ALL

HPO personnalisable

Oui

Détermine les types de données chronologiques connexes à inclure dans le modèle.

Choisissez l'une des quatre options suivantes :

  • ALL: Incluez toutes les séries chronologiques connexes fournies.

  • NONE: Exclure toutes les séries chronologiques connexes fournies.

  • HISTORICAL: N'incluez que les séries chronologiques connexes qui ne s'étendent pas jusqu'à l'horizon de prévision.

  • FORWARD_LOOKING: N'incluez que les séries chronologiques connexes qui s'étendent jusqu'à l'horizon de prévision.

HISTORICALinclut toutes les séries chronologiques liées à l'historique etFORWARD_LOOKING inclut toutes les séries chronologiques prospectives. Vous ne pouvez pas choisir un sous-ensembleHISTORICAL ou une série chronologiqueFORWARD_LOOKING associée.

use_item_metadata
Valeurs valides

ALL

NONE

Valeur par défaut

ALL

HPO personnalisable

Oui

Détermine si le modèle inclut les métadonnées des éléments.

Choisissez l'une des deux options suivantes :

  • ALL: inclut toutes les métadonnées de l'élément fournies.

  • NONE: excluez toutes les métadonnées d'élément fournies.

use_item_metadatainclut toutes les métadonnées des éléments fournies ou aucune. Vous ne pouvez pas sélectionner un sous-ensemble de métadonnées d'élément.

epochs
Valeurs valides

Entiers positifs

Valeurs typiques

10 à 1000

Valeur par défaut

100

HPO personnalisable

Non

Nombre maximum de passages complets sur les données d'entraînement. Les petits ensembles de données nécessitent plus d'époques.

Pour les valeurs élevées deForecastHorizon etcontext_length, envisagez de diminuer les époques afin d'améliorer le temps d'entraînement.

Optimisation des hyperparamètres (HPO)

L'optimisation des hyperparamètres (HPO) consiste à sélectionner les valeurs d'hyperparamètres optimales pour un objectif d'apprentissage spécifique. Avec Forecast, vous pouvez automatiser ce processus de deux manières :

  1. En choisissant AutoML, HPO s'exécutera automatiquement pour CNN-QR.

  2. Sélection manuelle de CNN-QR et réglagePerformHPO = TRUE.

L'ajout de séries chronologiques et de métadonnées d'articles connexes n'améliore pas toujours la précision de votre modèle CNN-QR. Lorsque vous exécutez AutoML ou activez HPO, CNN-QR teste la précision de votre modèle avec et sans les séries chronologiques et les métadonnées d'éléments connexes fournies, et sélectionne le modèle avec la plus grande précision.

Amazon Forecast optimise automatiquement les trois hyperparamètres suivants lors d'une HPO et vous fournit les valeurs d'entraînement finales :

  • context_length : détermine jusqu'où le réseau peut voir dans le passé. Le processus HPO définit automatiquement une valeurcontext_length qui maximise la précision du modèle, tout en tenant compte du temps de formation.

  • use_related_data : détermine les formes de données de séries chronologiques connexes à inclure dans votre modèle. Le processus HPO vérifie automatiquement si les données de vos séries chronologiques associées améliorent le modèle et sélectionne le réglage optimal.

  • use_item_metadata : détermine s'il faut inclure les métadonnées des éléments dans votre modèle. Le processus HPO vérifie automatiquement si les métadonnées de votre article améliorent le modèle et choisit le paramètre optimal.

Note

Si la fonctionHoliday supplémentaireuse_related_data est sélectionnéeNONE ouHISTORICAL si elle est sélectionnée, cela signifie que l'inclusion des données relatives aux vacances n'améliore pas la précision du modèle.

Vous pouvez définir la configuration HPO pour l'context_lengthhyperparamètre si vous la définissezPerformHPO = TRUE lors de la sélection manuelle. Toutefois, vous ne pouvez modifier aucun aspect de la configuration HPO si vous choisissez AutoML. Pour plus d'informations sur la configuration HPO, consultez l'IntergerParameterRangeAPI.

Conseils et bonnes pratiques

Évitez les valeurs élevées pour ForecastHorizon - L'utilisation de valeurs supérieures à 100 augmente leForecastHorizon temps d'entraînement et peut réduire la précision du modèle. Si vous souhaitez procéder à des prévisions plus lointaines, envisagez de regrouper vos données à une fréquence plus élevée. Par exemple, utilisez 5min plutôt que 1min.

Les CNN permettent une longueur de contexte plus longue. Avec CNN-QR, vous pouvez définir une valeurcontext_length légèrement supérieure à celle de Deepar+, car les CNN sont généralement plus efficaces que les RNN.

Ingénierie des fonctionnalités des données associées : essayez différentes combinaisons de séries chronologiques et de métadonnées d'éléments connexes lors de l'entraînement de votre modèle, et évaluez si les informations supplémentaires améliorent la précision. Différentes combinaisons et transformations de séries chronologiques et de métadonnées d'éléments connexes produiront des résultats différents.

CNN-QR ne fait pas de prévisions au quantile moyen : lorsque vous le configurezForecastTypesmean avec l' CreateForecastAPI, les prévisions seront plutôt générées au quantile médian (0.5ouP50).