更新資料 - Amazon Forecast

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

更新資料

當您收集新資料時,您會想要將該資料匯入「Forecast」。要做到這一點,你有兩個選擇,替換和增量更新。取代資料集匯入工作會以新匯入的資料覆寫所有現有資料。累加式更新會將新匯入的資料附加至資料集。

匯入新資料之後,您可以使用現有的預測值來產生該資料的預測。

匯入模式

若要設定 Amazon Forecast 將新資料新增至現有資料集的方式,請為資料集匯入任務指定匯入模式。預設匯入模式為FULL。您只能使用 Amazon Forecast API 來設定匯入模式。

  • 若要覆寫資料集中的所有現有資料,請FULLCreateDatasetImportJob API 作業中指定。

  • 若要將記錄附加至資料集中的現有資料,請INCREMENTALCreateDatasetImportJob API 作業中指定。如果現有記錄和匯入的記錄具有相同的時間序列 ID (項目 ID、維度和時間戳記),則現有記錄會取代為新匯入的記錄。Amazon Forecast 始終使用帶有最新時間戳記的記錄。

如果您尚未匯入資料集,則無法使用增量選項。預設的匯入模式是完全取代。

增量匯入模式準則

執行增量資料集匯入時,您無法變更時間戳記格式、資料格式或地理位置資料。若要變更任何這些項目,您必須執行完整的資料資料集匯入。

更新現有資料集

重要

根據預設,資料集匯入工作會取代您匯入至的資料集中的任何現有資料。您可以透過指定資料集匯入工作來變更此設定匯入模式

若要更新資料集,請為資料集建立資料集匯入工作,並指定匯入模式。

CLI

若要更新資料集,請使用create-dataset-import-job指令。對於import-mode,請指定FULL、取代既有資料或加入INCREMENTAL至現有資料。如需詳細資訊,請參閱 匯入模式

下列程式碼會示範如何建立資料集匯入工作,以遞增方式將新資料匯入資料集。

aws forecast create-dataset-import-job \ --dataset-import-job-name dataset import job name \ --dataset-arn dataset arn \ --data-source "S3Config":{"KMSKeyArn":"string", "Path":"string", "RoleArn":"string"} \ --import-mode INCREMENTAL
Python

若要更新資料集,請使用create_dataset_import_job方法。對於import-mode,請指定FULL、取代既有資料或加入INCREMENTAL至現有資料。如需詳細資訊,請參閱 匯入模式

import boto3 forecast = boto3.client('forecast') response = forecast.create_dataset_import_job( datasetImportJobName = 'YourImportJob', datasetArn = 'dataset_arn', dataSource = {"S3Config":{"KMSKeyArn":"string", "Path":"string", "RoleArn":"string"}}, importMode = 'INCREMENTAL' )

更新預測

當您收集新資料時,您可能想要使用它來產生新的預測。當您匯入更新的資料集時,Forecast 不會自動重新訓練預測值,但您可以手動重新訓練預測值,以使用更新的資料產生新預測。例如,如果您收集每日銷售資料,並希望在預測中包含新的資料點,則可以匯入更新的資料並使用它來產生預測,而無需訓練新的預測值。若要讓新匯入的資料對您的預測產生影響,您必須重新訓練預測值。

若要從新資料產生預測,請執行下列動作:
  1. 將新資料上傳到 Amazon S3 儲存貯體。您的新資料應該只包含自上次匯入資料集之後新增的資料。

  2. 使用新資料建立增量資料集匯入工作。新資料會附加至現有資料,並從更新的資料產生預測。如果您的新資料檔案同時包含先前匯入的資料和新資料,請建立完整資料集匯入工作。

  3. 使用現有的預測器建立新的預測。

  4. 像往常一樣擷取預測。