入门(控制台) - Amazon Forecast

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

入门(控制台)

在本练习中,您将使用 Amazon Forecast 控制台导入用电量的时间序列数据,根据输入数据集创建预测变量,并根据预测范围预测future 用电量。

在本练习中,您将使用修改后的个人家庭用电量数据集。(Dua,D. 和 Karra Taniskidou,E.(2017)。 UCI Machine Lear ning 存储库 [http://archive.ics.uci.edu/ml]。 加利福尼亚州欧文:加州大学信息与计算机科学学院。) 我们将每小时汇总使用率数据。修改后的数据以 zip 文件 electricityusagedata.zip 的形式提供。

先决条件

请注意,本练习中有几个步骤需要几分钟到几小时才能完成。

要将时间序列数据导入 Amazon Forecast,请创建一个数据集组,为数据集组选择一个域,指定数据的详细信息,然后将 Amazon Forecast 指向数据的 S3 位置。本示例中使用的目标时间序列是历史用电数据。

注意

该练习假定您尚未创建任何数据集组。如果您之前创建了一个数据集组,您看到的内容与以下屏幕截图和说明将略有不同。

导入时间序列数据进行预测
  1. 通过 https://console.aws.amazon.com/forecast/ 打开Amazon Forecast 控制台。

  2. 在 Amazon Forecast 主页上,选择创建数据集组

  3. Create dataset group (创建数据集组) 页面上,对于 Dataset group details (数据集组详细信息),提供以下信息:

    • 数据集组名称

    • 预测域。从下拉菜单中,选择 Custom。有关如何选择预测域的更多信息,请参阅数据集域和类型

    保持 “标签” 部分不变。您的屏幕应类似于以下内容:

  4. 选择 Next(下一步)

  5. Create target time series dataset (创建目标时间序列数据集) 页面上,对于 Dataset details (数据集详细信息),请提供以下信息:

    • 数据集名称-输入数据集的名称。

    • 数据频率-保留默认值1,然后从下拉菜单中选择小时。此设置必须与输入时间序列数据一致。示例用电量数据中的时间间隔为一个小时。

    • 数据架构-选择 Schema Builder,然后从上到下拖动列组件以匹配时间序列数据顺序。

      1. 时间戳-使用默认的时间戳格式yyyy-MM-dd HH:mm:ss

      2. 目标值

      3. item_id

      对于用电量输入数据,这些列对应于:时间戳、指定时间的用电量(target_value)和为用电量收取费用的客户的 ID(字符串)。此处指定的列顺序和时间戳格式必须与输入的时间序列数据一致。

    数据集详细信息面板应类似于以下内容:

  6. 有关数据集导入详细信息,请提供以下信息:

    • 数据集导入名称-输入数据集的名称。

    • 选择时区-保留默认选中时区(请勿使用时区)。

    • 数据位置 — 使用以下格式输入您的.csv 文件在 Amazon S3 上的位置:

      s3://<name of your S3 bucket>/<folder path>/<filename.csv>

    • IAM 角色 — 保留默认值输入自定义 IAM 角色 ARN

      或者,您可以让 Amazon Forecast 为您创建所需的 IAM 角色,方法是从下拉菜单中选择创建新角色并按照屏幕上的说明进行操作。

    • 自定义 IAM 角色的 Amazon 资源名称(ARN)为Amazon Forecast 创建 IAM 角色(IAM 控制台)

    数据集导入细节应类似于以下内容:

  7. 选择开始。如果您返回到 Amazon Forecast 主页,请选择创建数据集组

  8. 单击刚创建的数据集组的名称。此时会显示该数据集组的 Dashboard (控制面板) 页面。您的屏幕应类似于以下内容:

    目标时间序列数据旁边,您将看到导入任务的状态。等待 Amazon Forecast 完成导入您的时间序列数据。此过程可能需要几分钟或更长时间。导入数据集后,状态将变为 “活动”,仪表板顶部的横幅会通知您已成功导入数据。

    现在您的目标时间序列数据集已导入,您可以创建预测变量。

接下来,创建一个预测变量,用于根据时间序列数据生成预测。Forecast 将最佳算法组合应用于数据集中的每个时间序列

要使用Forecast 控制台创建预测变量,请指定预测变量名称、预测频率并定义预测展望期。有关可配置的其他字段的更多信息训练预测器

创建预测器
  1. 您的目标时间序列数据集已完成导入后,您的数据集组的 Dashboard (控制面板) 应与下图类似:

    Train a predictor (训练预测器) 下,选择 Start (开始)。将会显示 Train predictor (训练预测器) 页面。

    注意

    目标时间序Status列数据中的值必须为Active,这表示导入已成功完成,然后才能训练预测变量。

  2. 训练预测器页面上,为预测器设置提供以下信息:

    • 预测变量名称-输入预测变量的名称。

    • Forecast 频率-保持默认值为1。从下拉菜单中,选择 hour (小时)。此设置必须与输入时间序列数据一致。示例用电量数据中的时间间隔为一个小时。

    • Forecast 范围 — 选择在future 多长时间内进行预测。此数字乘以您在Step 1: Import the Training Data中指定的数据输入频率 (hourly) 可确定对未来多久进行预测。在本练习中,将此数字设置为 36 以提供 36 小时的预测。

    • Forecast 维度和 For ecast 分位数-保留这些字段的默认值。

    其余的输入数据配置标签部分是可选的,因此请保留默认值。预测器设置部分应类似于以下内容:

  3. 选择 Create(创建)。此时会显示您的数据集组的 Dashboard (控制面板) 页面。您的屏幕应类似于以下内容:

  4. 要查找预测变量的状态,请选择查看预测变量

  5. 预测变量页面上,在训练状态列中找到您的预测变量的状态。您的屏幕应类似于以下内容:

    等待 Amazon Forecast 完成对预测器的训练。此过程可能需要几分钟或更长时间。当您的预测变量经过训练后,状态将变为 “活动”,并显示一条横幅,通知您可以开始生成预测。

在预测变量处于活动状态后,您可以创建预测。预测是一组预测,目标数据集中的每个项目对应一个预测。要检索完整预测,您可以创建导出任务。

获取并查看您的预测
  1. 在数据集组的仪表板上,在For ecast 生成下,选择开始。此时将显示 Create a forecast (创建预测) 页面。

    注意

    Status在生成预测Active之前,必须先进行预测训练

  2. Create a forecast (创建预测) 页面上,对于 Forecast details (预测详细信息),提供以下信息:

    • Forecast 名称-输入预测的名称。

    • 预测变量。从下拉菜单中,选择您在其中创建的预测变量Step 2: Train a Predictor

    For ecast 分位数和标签字段是可选的,因此请保留默认值。您的屏幕应类似于以下内容:

    单击 “开始”。

  3. 将显示 “预测” 页面。您的屏幕应类似于以下内容:

    状态列列出了您的预测状态。等待 Amazon Forecast 完成预测的创建。此过程可能需要几分钟或更长时间。创建预测后,状态将变为 “有效”。

    现在您的预测已经创建,您可以导出预测了。

创建预测后,您可以导出完整的预测。

导出完整预测
  1. 在数据集组页面上,单击您在中创建的数据集组Step 1: Import Training Data

  2. 单击屏幕 的左上角可打开导航窗格。在您的数据集组下,点击预测

  3. 选择您在Step 3: Create a Forecast中创建的预测旁的单选按钮。

  4. 选择 Create forecast export (创建预测导出)。此时将显示 Create forecast export (创建预测导出) 页面。

  5. Create forecast export (创建预测导出) 页面上,对于 Export details (导出详细信息),提供以下信息。

    • 导出名称-输入预测导出任务的名称。

    • IAM 角色 — 保留默认值输入自定义 IAM 角色 ARN

      或者,您可以让 Amazon Forecast 为您创建所需的 IAM 角色,方法是从下拉菜单中选择创建新角色并按照屏幕上的说明进行操作。

    • 自定义 IAM 角色的 Amazon 资源名称(ARN)为Amazon Forecast 创建 IAM 角色(IAM 控制台)

    • S3 预测导出位置 — 使用以下格式输入存储桶中您的亚马逊Simple Storage Service (Amazon S3) 存储段或文件夹的位置:

      s3://<name of your S3 bucket>/<folder path>/

    您的屏幕应类似于以下内容:

  6. 单击 “开始”。将显示 “预测” 页面。

  7. 点击您在中创建的预测Step 3: Create a Forecast。找到 “导出” 部分。您的屏幕应类似于以下内容:

    您应该可以看到状态进度。等待 Amazon Forecast 完成预测导出。此过程可能需要几分钟或更长时间。当您的预测已导出时,状态会转换为 Active (活动),并且您可以在 S3 存储桶中找到预测文件。