Mise à jour de données - Amazon Forecast

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Mise à jour de données

Au fur et à mesure que vous collectez de nouvelles données, vous souhaiterez les importer dans Forecast. Pour ce faire, deux options s'offrent à vous : le remplacement et les mises à jour incrémentielles. Une tâche d'importation de jeu de données de remplacement remplacera toutes les données existantes par les données nouvellement importées. Une mise à jour incrémentielle ajoutera les données nouvellement importées à l'ensemble de données.

Après avoir importé vos nouvelles données, vous pouvez utiliser un prédicteur existant pour générer une prévision pour ces données.

Modes d'importation

Pour configurer la manière dont Amazon Forecast ajoute de nouvelles données à un ensemble de données existant, vous devez spécifier le mode d'importation de votre tâche d'importation de jeu de données. Le mode d'importation par défaut estFULL. Vous ne pouvez configurer le mode d'importation qu'à l'aide de l'API Amazon Forecast.

  • Pour remplacer toutes les données existantes de votre ensemble de données, spécifiez-les FULL dans l'opération CreateDatasetImportJob d'API.

  • Pour ajouter les enregistrements aux données existantes de votre ensemble de données, spécifiez-le INCREMENTAL dans l'opération CreateDatasetImportJob d'API. Si un enregistrement existant et un enregistrement importé ont le même identifiant de série chronologique (ID d'article, dimension et horodatage), l'enregistrement existant est remplacé par le nouvel enregistrement importé. Amazon Forecast utilise toujours l'enregistrement avec l'horodatage le plus récent.

Si vous n'avez pas importé de jeu de données, l'option incrémentielle n'est pas disponible. Le mode d'importation par défaut est le remplacement complet.

Directives relatives au mode d'importation incrémentielle

Lorsque vous importez un jeu de données incrémentiel, vous ne pouvez pas modifier le format d'horodatage, le format des données ou les données de géolocalisation. Pour modifier l'un de ces éléments, vous devez effectuer une importation complète du jeu de données.

Mise à jour des ensembles de données existants

Important

Par défaut, une tâche d'importation d'un ensemble de données remplace toutes les données existantes du jeu de données dans lequel vous l'avez importé. Vous pouvez modifier cela en spécifiant les tâches d'importation de l'ensemble de donnéesModes d'importation.

Pour mettre à jour un ensemble de données, créez une tâche d'importation de jeu de données pour l'ensemble de données et spécifiez le mode d'importation.

CLI

Pour mettre à jour un ensemble de données, utilisez la create-dataset-import-job commande. Pour leimport-mode, spécifiezFULL, pour remplacer les données existantes ou INCREMENTAL pour y ajouter des données. Pour plus d’informations, consultez Modes d'importation.

Le code suivant montre comment créer une tâche d'importation d'ensemble de données qui importe progressivement de nouvelles données dans un ensemble de données.

aws forecast create-dataset-import-job \ --dataset-import-job-name dataset import job name \ --dataset-arn dataset arn \ --data-source "S3Config":{"KMSKeyArn":"string", "Path":"string", "RoleArn":"string"} \ --import-mode INCREMENTAL
Python

Pour mettre à jour un ensemble de données, utilisez la create_dataset_import_job méthode. Pour leimport-mode, spécifiezFULL, pour remplacer les données existantes ou INCREMENTAL pour y ajouter des données. Pour plus d’informations, consultez Modes d'importation.

import boto3 forecast = boto3.client('forecast') response = forecast.create_dataset_import_job( datasetImportJobName = 'YourImportJob', datasetArn = 'dataset_arn', dataSource = {"S3Config":{"KMSKeyArn":"string", "Path":"string", "RoleArn":"string"}}, importMode = 'INCREMENTAL' )

Mise à jour des prévisions

Lorsque vous collectez de nouvelles données, vous souhaiterez peut-être les utiliser pour générer de nouvelles prévisions. Forecast ne réentraîne pas automatiquement un prédicteur lorsque vous importez un jeu de données mis à jour, mais vous pouvez le réentraîner manuellement pour générer une nouvelle prévision avec les données mises à jour. Par exemple, si vous collectez des données de ventes quotidiennes et que vous souhaitez inclure de nouveaux points de données dans vos prévisions, vous pouvez importer les données mises à jour et les utiliser pour générer une prévision sans avoir à créer de nouveau prédicteur. Pour que les données récemment importées aient un impact sur vos prévisions, vous devez réentraîner le prédicteur.

Pour générer une prévision à partir des nouvelles données, procédez comme suit :
  1. Téléchargez les nouvelles données dans un compartiment Amazon S3. Vos nouvelles données ne doivent contenir que les données ajoutées depuis la dernière importation de votre ensemble de données.

  2. Créez une tâche d'importation de jeux de données incrémentielle avec les nouvelles données. Les nouvelles données sont ajoutées aux données existantes et les prévisions sont générées à partir des données mises à jour. Si votre nouveau fichier de données contient à la fois des données importées précédemment et de nouvelles données, créez une tâche d'importation complète du jeu de données.

  3. Créez une nouvelle prévision à l'aide du prédicteur existant.

  4. Récupérez les prévisions comme d'habitude.