Atualização de dados - Amazon Forecast

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Atualização de dados

Ao coletar novos dados, você precisará importá-los para o Forecast. Para fazer isso, você tem duas opções: atualizações de substituição e incrementais. Uma tarefa de importação de conjunto de dados de substituição sobregravará todos os dados existentes pelos dados recém-importados. Uma atualização incremental anexará os dados recém-importados ao conjunto de dados.

Após importar os novos dados, você pode usar um preditor existente para gerar uma previsão para esses dados.

Modos de importação

Para configurar como o Amazon Forecast adiciona novos dados ao conjunto de dados existente, você especifica o modo de importação para seu trabalho de importação de conjunto de dados. O modo de importação padrão é FULL. Você só pode configurar o modo de importação usando a API do Amazon Forecast.

  • Para substituir todos os dados do conjunto de dados, especifique FULL na operação de API CreateDatasetImportJob.

  • Para anexar os registros aos dados existentes no seu conjunto de dados, especifique INCREMENTAL na operação de API CreateDatasetImportJob. Se um registro existente e um registro importado tiverem a mesma ID de série temporal (ID do item, dimensão e carimbo de data/hora), o registro existente será substituído pelo registro recém-importado. O Amazon Forecast sempre usa o registro com o carimbo de data e hora mais recente.

Se você não importou um conjunto de dados, a opção incremental não está disponível. O modo de importação padrão é uma substituição completa.

Diretrizes do modo de importação incremental

Ao realizar uma importação incremental do conjunto de dados, você não pode alterar o formato do carimbo de data/hora, o formato dos dados ou os dados de geolocalização. Para alterar qualquer um desses itens, você precisa realizar uma importação completa do conjunto de dados.

Como atualizar os conjuntos de dados existentes

Importante

Por padrão, um trabalho de importação de conjunto de dados substitui todos os dados existentes no conjunto de dados para o qual você importou os dados. Você pode alterar isso especificando os Modos de importação do trabalho de importação de conjunto de dados.

Para atualizar um conjunto de dados, crie um trabalho de importação para o conjunto de dados e especifique o modo de importação.

CLI

Para atualizar um conjunto de dados, use o comando create-dataset-import-job. Para o import-mode, especifique FULL para substituir os dados existentes ou INCREMENTAL para adicionar dados a ele. Para ter mais informações, consulte Modos de importação.

O código a seguir mostra como criar um trabalho de importação de conjunto de dados que importa novos dados de forma incremental para um conjunto de dados.

aws forecast create-dataset-import-job \ --dataset-import-job-name dataset import job name \ --dataset-arn dataset arn \ --data-source "S3Config":{"KMSKeyArn":"string", "Path":"string", "RoleArn":"string"} \ --import-mode INCREMENTAL
Python

Para atualizar um conjunto de dados, use o método create_dataset_import_job. Para o import-mode, especifique FULL para substituir os dados existentes ou INCREMENTAL para adicionar dados a ele. Para ter mais informações, consulte Modos de importação.

import boto3 forecast = boto3.client('forecast') response = forecast.create_dataset_import_job( datasetImportJobName = 'YourImportJob', datasetArn = 'dataset_arn', dataSource = {"S3Config":{"KMSKeyArn":"string", "Path":"string", "RoleArn":"string"}}, importMode = 'INCREMENTAL' )

Como atualizar previsões

Ao coletar novos dados, talvez você precise usá-los para gerar novas previsões. O Forecast não treina automaticamente um preditor quando você importa um conjunto de dados atualizado, mas você pode treinar manualmente um preditor para gerar uma nova previsão com os dados atualizados. Por exemplo, caso colete dados de vendas diárias e queira incluir novos pontos de dados na previsão, você poderá importar os dados atualizados e usá-los para gerar uma previsão sem treinar um novo preditor. Para que os dados recém-importados tenham um impacto em suas previsões, você deve treinar novamente o preditor.

Para gerar uma previsão com base nos novos dados:
  1. Fala upload dos novos dados para um bucket do Amazon S3. Seus novos dados devem conter somente os dados adicionados desde a última importação do conjunto de dados.

  2. Crie um trabalho de importação de conjunto de dados incremental com os novos dados. Os novos dados são anexados aos dados existentes e a previsão é gerada a partir dos dados atualizados. Se seu novo arquivo de dados contiver dados importados anteriormente e dados novos, crie um trabalho de importação de conjunto de dados completo.

  3. Crie uma previsão usando o preditor existente.

  4. Recupere a previsão normalmente.