데이터 업데이트 - Amazon Forecast

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

데이터 업데이트

새 데이터를 수집하면 Forecast로 가져올 수 있습니다. 이를 위해서는 대체 업데이트와 증분 업데이트라는 두 옵션을 사용하면 됩니다. 대체 데이터 세트 가져오기 작업은 모든 기존 데이터를 새로 가져온 데이터로 덮어씁니다. 증분 업데이트는 새로 가져온 데이터를 데이터 세트에 추가합니다.

새 데이터를 가져온 후 기존 예측기를 사용하여 해당 데이터에 대한 예측을 생성할 수 있습니다.

가져오기 모드

Amazon Forecast가 기존 데이터 세트에 새 데이터를 추가하는 방법을 구성하려면 데이터 세트 가져오기 작업의 가져오기 모드를 지정합니다. 기본 가져오기 모드는 FULL입니다. 가져오기 모드는 Amazon Forecast API를 사용해야만 구성할 수 있습니다.

  • 데이터 세트의 기존 데이터를 모두 덮어쓰려면 CreateDatasetImportJob API 작업에서 FULL을 지정합니다.

  • 데이터 세트의 기존 데이터에 레코드를 추가하려면 CreateDatasetImportJob API 작업에서 INCREMENTAL을 지정합니다. 기존 레코드와 가져온 레코드의 시계열 ID(항목 ID, 차원, 타임스탬프)가 동일한 경우 기존 레코드가 새로 가져온 레코드로 대체됩니다. Amazon Forecast는 항상 가장 최근의 타임스탬프가 있는 레코드를 사용합니다.

데이터 세트를 가져오지 않은 경우 증분 옵션을 사용할 수 없습니다. 기본 가져오기 모드는 전체 대체입니다.

증분 가져오기 모드 지침

증분 데이터 세트 가져오기를 수행할 때는 타임스탬프 형식, 데이터 형식 또는 지리적 위치 데이터를 변경할 수 없습니다. 이러한 항목을 변경하려면 전체 데이터 데이터 세트 가져오기를 수행해야 합니다.

기존 데이터 세트 업데이트

중요

기본적으로 데이터 세트 가져오기 작업은 가져온 데이터 세트의 모든 기존 데이터를 대체합니다. 데이터 세트 가져오기 작업의 가져오기 모드를 지정하여 이를 변경할 수 있습니다.

데이터 세트를 업데이트하려면 해당 데이터 세트의 데이터 세트 가져오기 작업을 생성하고 가져오기 모드를 지정하세요.

CLI

데이터 세트를 업데이트하려면 create-dataset-import-job 명령을 사용하세요. import-mode의 경우 기존 데이터를 대체하려면 FULL을 지정하고 기존 데이터에 추가하려면 INCREMENTAL을 지정합니다. 자세한 설명은 가져오기 모드 섹션을 참조하세요.

다음 코드는 새 데이터를 데이터 세트에 증분적으로 가져오는 데이터 세트 가져오기 작업을 생성하는 방법을 보여줍니다.

aws forecast create-dataset-import-job \ --dataset-import-job-name dataset import job name \ --dataset-arn dataset arn \ --data-source "S3Config":{"KMSKeyArn":"string", "Path":"string", "RoleArn":"string"} \ --import-mode INCREMENTAL
Python

데이터 세트를 업데이트하려면 create_dataset_import_job 메서드를 사용하세요. import-mode의 경우 기존 데이터를 대체하려면 FULL을 지정하고 기존 데이터에 추가하려면 INCREMENTAL을 지정합니다. 자세한 설명은 가져오기 모드 섹션을 참조하세요.

import boto3 forecast = boto3.client('forecast') response = forecast.create_dataset_import_job( datasetImportJobName = 'YourImportJob', datasetArn = 'dataset_arn', dataSource = {"S3Config":{"KMSKeyArn":"string", "Path":"string", "RoleArn":"string"}}, importMode = 'INCREMENTAL' )

예측 업데이트

새 데이터를 수집하면 이를 사용하여 새 예측을 생성할 수 있습니다. 업데이트된 데이터 세트를 가져와도 Forecast가 예측기를 자동으로 재훈련하지는 않지만, 업데이트된 데이터로 새 예측을 생성하도록 예측기를 수동으로 재훈련할 수는 있습니다. 예를 들어, 일일 판매 데이터를 수집하고 예측에 새 데이터 포인트를 포함하려는 경우 업데이트된 데이터를 가져와서 새 예측기를 훈련하지 않고도 이 데이터를 사용하여 예측을 생성할 수 있습니다. 새로 가져온 데이터가 예측에 영향을 미치려면 예측기를 다시 훈련해야 합니다.

새 데이터에서 예측을 생성하려면:
  1. Amazon S3 버킷에 새 데이터를 업로드합니다. 새 데이터에는 마지막 데이터 세트 가져오기 이후에 추가된 데이터만 포함되어야 합니다.

  2. 새 데이터를 사용하여 증분 데이터 세트 가져오기 작업을 생성합니다. 새 데이터가 기존 데이터에 추가되고 업데이트된 데이터에서 예측이 생성됩니다. 새 데이터 파일에 이전에 가져온 데이터와 새 데이터가 모두 포함되어 있는 경우 전체 데이터 세트 가져오기 작업을 생성하세요.

  3. 기존 예측기를 사용하여 새 예측을 생성합니다.

  4. 일반적인 방법으로 예측을 가져옵니다.