训练Forecast - Amazon Forecast

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

训练Forecast

预测变量是一种 Amazon Forecast 模型,使用您的目标时间序列、相关时间序列、项目元数据和您包含的任何其他数据集进行训练。您可以使用预测变量根据您的时间序列数据生成预测。

默认情况下,Amazon Forecast 会创建一个 AutoPredictor,其中 Forecast 将算法的最佳组合应用于数据集中的每个时间序列。

创建Forecast

Amazon Forecast 需要以下输入来训练预测变量:

  • 数据集组— 必须包含目标时间序列数据集的数据集组。目标时间序列数据集包括目标属性 (item_id) 和时间戳属性以及任何维度。相关的时间序列和项目元数据是可选的。有关更多信息,请参阅 导入数据集

  • Forecast— 预测的精细度(每小时、每天、每周等)。Amazon Forecast 允许您在提供频率单位和值时确定预测的确切粒度。只允许使用整数值

    频率单位 允许的值
    Minute 1-59 9 日
    每小时 1-23 日 23 日
    每天 1-6 6 6 6
    每周 1-4
    每月 1-11 年 11 日
    每年 1

    例如,如果您想每隔一周进行一次预测,则您的频率单位是每周,值为 2。或者,如果您想要季度预测,则您的频率单位是每月,值为 3。

    当收集数据的频率高于预测频率时,会将其汇总到预测频率中。这包括追踪时间序列和相关的时间序列数据。有关聚合的更多信息,请参阅不同预测频率的数据聚合.

  • Forecast— 预测的时间步长。

您还可以为以下可选输入设置值:

  • 时间对齐边界— Forecast 用于汇总数据并生成与您指定的预测频率一致的预测的时间界限。有关聚合的更多信息,请参阅不同预测频率的数据聚合. 有关指定时间界限的信息,请参见时间边界.

  • Forecast— 维度是目标时间序列数据集中的可选属性,可以与目标值组合使用 (item_id)创建单独的时间序列。

  • Forecast— 用于评估预测变量的分位数。

  • 优化指标— 用于优化预测变量的精度指标。

  • 其他数据集— 内置的Amazon Forecast 数据集,例如天气指数和假期。

您可以使用软件开发套件 (SDK) 或 Amazon Forecast 控制台创建预测器。

Console

创建Forecast

  1. 登到处登录AWS Management Console然后打开 Amazon Forecast 控制台https://console.aws.amazon.com/forecast/.

  2. From数据集组,选择您的数据集组。

  3. 在导航窗格中,选择预测变量.

  4. 选择训练新的预测变量.

  5. 为以下必填字段提供以下值:

    • 名称-一个唯一的预测变量名称。

    • Forecast-您的预测的精细度。

    • Forecast-要预测的时间步数。

  6. 选择开始

有关其他数据集的信息,请参见 天气指数假日功能. 了解有关Forecast 类型和优化指标的更多信息,请参阅评估预测器准确率.

AWS CLI

创建auto ForecastAWS CLI,使用create-auto-predictor命令。以下代码创建了一个auto 预测器,用于预测future 14 天。

为包含训练数据提供Forecast (ARN)。(可选)修改预测展望期和预测频率。(可选)为预测变量添加任何标签。有关更多信息,请参阅Amazon Forecast.

有关必需参数和可选参数的信息,请参阅CreateAutoPredictor.

aws forecast create-auto-predictor \ --predictor-name predictor_name \ --data-config DatasetGroupArn="arn:aws:forecast:region:account:dataset-group/datasetGroupName" \ --forecast-horizon 14 \ --forecast-frequency D \ --tags Key=key1,Value=value1 Key=key2,Value=value2

了解有关Forecast 类型和优化指标的更多信息,请参阅评估预测器准确率天气指数和假日附加数据集在DataConfigDatype。有关其他数据集的信息,请参见 天气指数假日功能.

Python

要使用 SDK for Python (Boto3) 创建自动Forecast,请使用create_auto_predictor方法。以下代码创建了一个auto 预测器,用于预测future 14 天。

为包含训练数据提供Forecast (ARN)。(可选)修改预测展望期和预测频率。(可选)为预测变量添加任何标签。有关更多信息,请参阅Amazon Forecast.

有关必需参数和可选参数的信息,请参阅CreateAutoPredictor.

import boto3 forecast = boto3.client('forecast') create_predictor_response = forecast.create_auto_predictor( PredictorName = 'predictor_name', ForecastHorizon = 14, ForecastFrequency = 'D', DataConfig = { "DatasetGroupArn": "arn:aws:forecast:region:account:dataset-group/datasetGroupName" }, Tags = [ { "Key": "key1", "Value": "value1" }, { "Key": "key2", "Value": "value2" } ] ) print(create_predictor_response['PredictorArn'])

了解有关Forecast 类型和优化指标的更多信息,请参阅评估预测器准确率天气指数和假日附加数据集在DataConfigDatype。有关其他数据集的信息,请参见 天气指数假日功能.

升级至 AutoPredictor

Pythony

对于 a step-by-step 关于将预测变量升级到的指南 AutoPredictor,请参阅将预测变量升级为 AutoPredictor.

使用 AutoML 或手动选择创建的预测变量 (CreatePredictor) 可以升级到 AutoPredictor. 将现有升级到 AutoPredictor 将传输所有相关的预测器配置设置。

升级到处登载后 AutoPredictor,原始预测变量将保持活动状态,升级后的预测变量将具有单独的预测变量 ARN。这使您能够比较两个预测变量之间的精度指标,并且仍然可以使用原始预测变量生成预测。

您可以使用软件开发套件 (SDK) 或 Amazon Forecast 控制台升级预测器。

Console

升级Forecast

  1. 登到处登录AWS Management Console然后打开 Amazon Forecast 控制台https://console.aws.amazon.com/forecast/.

  2. 在导航窗格中,选择预测变量.

  3. 选择要升级的预测变量,然后选择升级.

  4. 为升级后的Forecast 设置唯一名称。

  5. 选择升级至 AutoPredictor.

CLI

要使用以下命令升级预测变量AWS CLI,使用create-auto-predictor方法,但要指定仅限预测变量名称和的值reference-predictor-arn(您要升级的预测变量的 ARN)。

aws forecast create-auto-predictor \ --predictor-name predictor_name \ --reference-predictor-arn arn:aws:forecast:region:account:predictor/predictorName
Python

要使用 SDK for Python (Boto3) 升级Forecast,请使用create_auto_predictor方法,但要指定仅限预测变量名称和的值ReferencePredictorArn(您要升级的预测变量的 ARN)。

import boto3 forecast = boto3.client('forecast') create_predictor_response = forecast.create_auto_predictor( PredictorName = 'predictor_name', ReferencePredictorArn = 'arn:aws:forecast:region:account:predictor/predictorName' ) print(create_predictor_response['PredictorArn'])

使用其他数据集

在创建预测指标时,Amazon Forecast 可以包括天气指数和假期。天气指数将气象信息纳入您的模型,假日包含有关国定假日的信息。

天气指数要求目标时间序列数据集中具有 “地理位置” 属性,以及有关时间戳时区的信息。有关更多信息,请参阅 天气指数

假日包括 66 个国家的假日信息。有关更多信息,请参阅 假日功能

使用传统预测变量

注意

将现有预测变量升级到 AutoPredictor,请参阅升级至 AutoPredictor

AutoPredictor 是使用 Amazon Forecast 创建预测变量的默认和首选方法。 AutoPredictor 通过为数据集中的每个时间序列应用最佳算法组合来创建预测变量。

使用创建的预测变量 AutoPredictor 通常比使用 AutoML 或手动选择创建的预测变量更准确。Forecast 可解释性和预测变量再训练功能仅适用于使用创建的预测变量 AutoPredictor.

Amazon Forecast:

  1. AutoML-Forecast 找到性能最佳的算法并将其应用于您的整个数据集。

  2. 手动选择-手动选择应用于整个数据集的单一算法。

你可以使用软件开发套件 (SDK) 创建传统预测器。

SDK

要使用 AutoML

使用CreatePredictor操作,设置值PerformAutoML"true".

{ ... "PerformAutoML": "true", }

如果您使用 AutoML,则无法为以下各项设置值 CreatePredictor参数:AlgorithmArn,HPOConfig,TrainingParameters.