本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
入门(控制台)
在本练习中,您将使用 Amazon Forecast 控制台导入用电量的时间序列数据,根据输入数据集创建预测变量,并根据预测范围预测future 用电量。
在本练习中,您将使用修改后的个人家庭用电量数据集。(Dua,D. 和 Karra Taniskidou,E.(2017)。 UCI Machine Lear ning 存储库 [http://archive.ics.uci.edu/ml
先决条件
-
一个 AWS 账户。如果您还没AWS 账户有注册 AWS。
-
Amazon Simple Storage Service (Amazon S3) 桶中的训练数据。有关更多信息,请参阅准备输入数据:
-
允许 Amazon Forecast 读取和写入您的 S3 存储桶的AWS Identity and Access Management (IAM) 角色。有关更多信息,请参阅为Amazon Forecast 创建 IAM 角色(IAM 控制台):
请注意,本练习中有几个步骤需要几分钟到几小时才能完成。
要将时间序列数据导入 Amazon Forecast,请创建一个数据集组,为数据集组选择一个域,指定数据的详细信息,然后将 Amazon Forecast 指向数据的 S3 位置。本示例中使用的目标时间序列是历史用电数据。
该练习假定您尚未创建任何数据集组。如果您之前创建了一个数据集组,您看到的内容与以下屏幕截图和说明将略有不同。
导入时间序列数据进行预测
-
通过 https://console.aws.amazon.com/forecast/
打开Amazon Forecast 控制台。 -
在 Amazon Forecast 主页上,选择创建数据集组。
-
在 Create dataset group (创建数据集组) 页面上,对于 Dataset group details (数据集组详细信息),提供以下信息:
-
数据集组名称。
-
预测域。从下拉菜单中,选择 Custom。有关如何选择预测域的更多信息,请参阅数据集域和类型。
保持 “标签” 部分不变。您的屏幕应类似于以下内容:
-
-
选择 Next(下一步)。
-
在 Create target time series dataset (创建目标时间序列数据集) 页面上,对于 Dataset details (数据集详细信息),请提供以下信息:
-
数据集名称-输入数据集的名称。
-
数据频率-保留默认值
1
,然后从下拉菜单中选择小时。此设置必须与输入时间序列数据一致。示例用电量数据中的时间间隔为一个小时。 数据架构-选择 Schema Builder,然后从上到下拖动列组件以匹配时间序列数据顺序。
-
时间戳-使用默认的时间戳格式
yyyy-MM-dd HH:mm:ss
。 -
目标值
-
item_id
对于用电量输入数据,这些列对应于:时间戳、指定时间的用电量(target_value)和为用电量收取费用的客户的 ID(字符串)。此处指定的列顺序和时间戳格式必须与输入的时间序列数据一致。
-
数据集详细信息面板应类似于以下内容:
-
-
有关数据集导入详细信息,请提供以下信息:
-
数据集导入名称-输入数据集的名称。
-
选择时区-保留默认选中时区(请勿使用时区)。
-
数据位置 — 使用以下格式输入您的.csv 文件在 Amazon S3 上的位置:
s3://<name of your S3 bucket>/<folder path>/<filename.csv>
-
IAM 角色 — 保留默认值输入自定义 IAM 角色 ARN。
或者,您可以让 Amazon Forecast 为您创建所需的 IAM 角色,方法是从下拉菜单中选择创建新角色并按照屏幕上的说明进行操作。
-
自定义 IAM 角色的 Amazon 资源名称(ARN)为Amazon Forecast 创建 IAM 角色(IAM 控制台)。
数据集导入细节应类似于以下内容:
-
-
选择开始。如果您返回到 Amazon Forecast 主页,请选择创建数据集组。
-
单击刚创建的数据集组的名称。此时会显示该数据集组的 Dashboard (控制面板) 页面。您的屏幕应类似于以下内容:
在目标时间序列数据旁边,您将看到导入任务的状态。等待 Amazon Forecast 完成导入您的时间序列数据。此过程可能需要几分钟或更长时间。导入数据集后,状态将变为 “活动”,仪表板顶部的横幅会通知您已成功导入数据。
现在您的目标时间序列数据集已导入,您可以创建预测变量。
接下来,创建一个预测变量,用于根据时间序列数据生成预测。Forecast 将最佳算法组合应用于数据集中的每个时间序列
要使用Forecast 控制台创建预测变量,请指定预测变量名称、预测频率并定义预测展望期。有关可配置的其他字段的更多信息训练预测器。
创建预测器
-
您的目标时间序列数据集已完成导入后,您的数据集组的 Dashboard (控制面板) 应与下图类似:
在 Train a predictor (训练预测器) 下,选择 Start (开始)。将会显示 Train predictor (训练预测器) 页面。
注意 目标时间序
Status
列数据中的值必须为Active
,这表示导入已成功完成,然后才能训练预测变量。 -
在训练预测器页面上,为预测器设置提供以下信息:
-
预测变量名称-输入预测变量的名称。
-
Forecast 频率-保持默认值为
1
。从下拉菜单中,选择 hour (小时)。此设置必须与输入时间序列数据一致。示例用电量数据中的时间间隔为一个小时。 -
Forecast 范围 — 选择在future 多长时间内进行预测。此数字乘以您在
Step 1: Import the Training Data
中指定的数据输入频率 (hourly
) 可确定对未来多久进行预测。在本练习中,将此数字设置为36
以提供 36 小时的预测。 -
Forecast 维度和 For ecast 分位数-保留这些字段的默认值。
其余的输入数据配置和标签部分是可选的,因此请保留默认值。预测器设置部分应类似于以下内容:
-
-
选择 Create(创建)。此时会显示您的数据集组的 Dashboard (控制面板) 页面。您的屏幕应类似于以下内容:
-
要查找预测变量的状态,请选择查看预测变量。
-
在预测变量页面上,在训练状态列中找到您的预测变量的状态。您的屏幕应类似于以下内容:
等待 Amazon Forecast 完成对预测器的训练。此过程可能需要几分钟或更长时间。当您的预测变量经过训练后,状态将变为 “活动”,并显示一条横幅,通知您可以开始生成预测。
在预测变量处于活动状态后,您可以创建预测。预测是一组预测,目标数据集中的每个项目对应一个预测。要检索完整预测,您可以创建导出任务。
获取并查看您的预测
-
在数据集组的仪表板上,在For ecast 生成下,选择开始。此时将显示 Create a forecast (创建预测) 页面。
注意 Status
在生成预测Active
之前,必须先进行预测训练。 -
在 Create a forecast (创建预测) 页面上,对于 Forecast details (预测详细信息),提供以下信息:
-
Forecast 名称-输入预测的名称。
-
预测变量。从下拉菜单中,选择您在其中创建的预测变量
Step 2: Train a Predictor
。
For ecast 分位数和标签字段是可选的,因此请保留默认值。您的屏幕应类似于以下内容:
单击 “开始”。
-
-
将显示 “预测” 页面。您的屏幕应类似于以下内容:
状态列列出了您的预测状态。等待 Amazon Forecast 完成预测的创建。此过程可能需要几分钟或更长时间。创建预测后,状态将变为 “有效”。
现在您的预测已经创建,您可以导出预测了。
创建预测后,您可以导出完整的预测。
导出完整预测
-
在数据集组页面上,单击您在中创建的数据集组
Step 1: Import Training Data
。 -
单击屏幕
的左上角可打开导航窗格。在您的数据集组下,点击预测。
-
选择您在
Step 3: Create a Forecast
中创建的预测旁的单选按钮。 -
选择 Create forecast export (创建预测导出)。此时将显示 Create forecast export (创建预测导出) 页面。
-
在 Create forecast export (创建预测导出) 页面上,对于 Export details (导出详细信息),提供以下信息。
-
导出名称-输入预测导出任务的名称。
-
IAM 角色 — 保留默认值输入自定义 IAM 角色 ARN。
或者,您可以让 Amazon Forecast 为您创建所需的 IAM 角色,方法是从下拉菜单中选择创建新角色并按照屏幕上的说明进行操作。
-
自定义 IAM 角色的 Amazon 资源名称(ARN)为Amazon Forecast 创建 IAM 角色(IAM 控制台)。
-
S3 预测导出位置 — 使用以下格式输入存储桶中您的亚马逊Simple Storage Service (Amazon S3) 存储段或文件夹的位置:
s3://<name of your S3 bucket>/<folder path>/
您的屏幕应类似于以下内容:
-
-
单击 “开始”。将显示 “预测” 页面。
-
点击您在中创建的预测
Step 3: Create a Forecast
。找到 “导出” 部分。您的屏幕应类似于以下内容:您应该可以看到状态进度。等待 Amazon Forecast 完成预测导出。此过程可能需要几分钟或更长时间。当您的预测已导出时,状态会转换为 Active (活动),并且您可以在 S3 存储桶中找到预测文件。