入门(控制台) - Amazon Forecast

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

入门(控制台)

在本练习中,您将使用 Amazon Forecast 控制台导入用电量的时间序列数据,根据输入数据集创建预测变量,并根据预测范围预测future 用电量。

在本练习中,您将使用修改后的个人家庭电力消耗数据集。(Dua、D. 和 Karra Taniskidou,E.(2017)。 UCI Machine Learning 存储库 [http://archive.ics.uci.edu/ml]。 加利福尼亚州欧文:加州大学信息与计算机科学学院。) 我们将每小时汇总使用率数据。修改后的数据以 zip 文件形式提供,electricityusagedata.zip.

先决条件

  • 一个亚马逊云科技账户。如果您还没有 AWS 账户,请按照中所述创建一个注册 AWS.

  • 您的 Amazon Simple Storage (Amazon S3) 存储桶。有关更多信息,请参阅 准备输入数据

  • 网络 ACL 和安全组都允许 (因此可到达您的实例) 的发起 ping 的AWS Identity and Access Management(IAM) 角色,允许 Amazon Forecast 读取和写入您的 S3 存储桶。有关更多信息,请参阅 为Amazon Forecast 创建 IAM 角色(IAM 控制台)

请注意,本练习中有几个步骤需要几分钟到几小时才能完成。

要将时间序列数据导入 Amazon Forecast,请创建一个数据集组,为数据集组选择一个域,指定数据的详细信息,然后将 Amazon Forecast 指向数据的 S3 位置。本示例中使用的目标时间序列是历史用电量数据。

注意

本练习假定您尚未创建任何数据集组。如果您之前创建了一个数据集组,您看到的内容与以下屏幕截图和说明将略有不同。

导入时间序列数据进行预测

  1. 打开 Amazon Forecast 控制台https://console.aws.amazon.com/forecast/.

  2. 在Amazon Forecast 主页上,选择创建数据集组.

  3. Create dataset group (创建数据集组) 页面上,对于 Dataset group details (数据集组详细信息),提供以下信息:

    • 数据集组名称— 输入数据集组的名称。

    • Forecast— 从下拉菜单中,选择Custom. 有关如何选择预测域的更多信息,请参阅数据集域和类型.

    离开标签部分不变。您的屏幕应类似于以下内容:

  4. 选择 Next(下一步)。

  5. Create target time series dataset (创建目标时间序列数据集) 页面上,对于 Dataset details (数据集详细信息),请提供以下信息:

    • 数据集名称— 输入数据集的名称。

    • 您的数据频率-保留默认值1,然后选择小时从下拉菜单中。此设置必须与输入时间序列数据一致。示例用电量数据中的时间间隔为一个小时。

    • 数据架构— 选择架构生成器然后从上到下拖动列组件以匹配时间序列数据顺序。

      1. 时间戳-使用默认值时间戳格式yyyy-MM-dd HH:mm:ss.

      2. target_value

      3. item_id

      对于用电量输入数据,各列对应于:时间戳、指定时间的用电量(target_value)和按用电量收费的客户的 ID(字符串)。此处指定的列顺序和时间戳格式必须与输入的时间序列数据一致。

    这些区域有:数据集详情面板应类似于以下内容:

  6. 对于数据集导入详细信息,请提供以下信息:

    • 数据集导入名称— 输入数据集的名称。

    • 选择时区— 将默认设置保留选中状态 (不要使用时区)。

    • 数据位置— 使用以下格式输入 .csv 文件在 Amazon S3 上的位置:

      s3://<name of your S3 bucket>/<folder path>/<filename.csv>

    • IAM 角色-保留默认值输入自定义 IAM 角色 ARN.

      或者,您可以选择 Amazon Forecast创建一个新角色从下拉菜单中,按照屏幕上的说明操作。

    • 自定义 IAM 角色 ARN— 输入您在中创建的 IAM 角色的 IAM 角色的 Amazon 资源名称 (ARN)为Amazon Forecast 创建 IAM 角色(IAM 控制台).

    这些区域有:数据集导入详细信息面板应类似于以下内容:

  7. 选择开始。如果您返回到 Amazon Forecast 主页,请选择创建数据集组.

  8. 单击刚刚创建的数据集组的名称。此时会显示该数据集组的 Dashboard (控制面板) 页面。您的屏幕应类似于以下内容:

    目标时间序列数据,您将看到导入任务的状态。等待 Amazon Forecast 完成导入您的时间序列数据。此过程可能需要几分钟或更长时间。导入数据集后,状态转换为处于活动状态仪表板顶部的横幅会通知您您已成功导入数据。

    现在您的目标时间序列数据集已经导入,您可以创建预测变量了。

接下来,创建一个预测变量,使用该预测变量根据时间序列数据生成预测。Forecast 将算法的最佳组合应用于数据集中的每个时间序列

要使用预测控制台创建Forecast 变量,您需要指定预测变量名称、预测频率并定义预测展望期。有关可以配置的其他字段的更多信息,请参阅训练Forecast.

创建预测器

  1. 您的目标时间序列数据集已完成导入后,您的数据集组的 Dashboard (控制面板) 应与下图类似:

    Train a predictor (训练预测器) 下,选择 Start (开始)。将会显示 Train predictor (训练预测器) 页面。

    注意

    这些区域有:Status目标时间序列数据必须是Active,这表示导入已成功完成,然后才能训练预测变量。

  2. 列车变量页面,对于Forecast,请提供以下信息:

    • 预测器名称— 输入预测变量的名称。

    • Forecast-保留默认值1. 从下拉菜单中,选择 hour (小时)。此设置必须与输入时间序列数据一致。示例用电量数据中的时间间隔为一个小时。

    • Forecast— 选择future 多久才能做出预测。此数字乘以您在Step 1: Import the Training Data中指定的数据输入频率 (hourly) 可确定对未来多久进行预测。在本练习中,将此数字设置为 36 以提供 36 小时的预测。

    • ForecastForecast— 保留这些字段的默认值。

    剩下的输入数据配置标签部分是可选的,因此请保留默认值。这些区域有:Forecast部分应类似于以下内容:

  3. 选择Create(创建)。此时会显示您的数据集组的 Dashboard (控制面板) 页面。您的屏幕应类似于以下内容:

  4. 要查找预测变量的状态,请选择查看Forecast.

  5. 预测变量页面在中查找您的预测变量的状态训练状态列。您的屏幕应类似于以下内容:

    等待 Amazon Forecast 完成预测变量的训练。此过程可能需要几分钟或更长时间。当您的预测变量经过训练后,状态将转换为处于活动状态并会显示一个横幅,通知您可以开始生成预测。

预测变量处于活动状态后,您可以创建预测。预测是一组预测,目标数据集中的每个项目对应一个预测。要检索完整预测,您可以创建导出任务。

获取并查看您的预测

  1. 在您的数据集组上控制面板,在Forecast,选择启动. 此时将显示 Create a forecast (创建预测) 页面。

    注意

    这些区域有:StatusForecast必须是Active然后才能生成预测。

  2. Create a forecast (创建预测) 页面上,对于 Forecast details (预测详细信息),提供以下信息:

    • Forecast— 输入预测的名称。

    • 预报器— 从下拉菜单中,选择您在中创建的预测变量Step 2: Train a Predictor.

    这些区域有:Forecast标签字段是可选的,因此请保留默认值。您的屏幕应类似于以下内容:

    单击启动.

  3. 这些区域有:Forecasts将显示页面。您的屏幕应类似于以下内容:

    这些区域有:状态列列出了您的预测状态... 等待Amazon Forecast 完成创建预测。此过程可能需要几分钟或更长时间。创建预测后,状态将转换为处于活动状态.

    现在您的预测已创建,您可以导出预测。

创建预测后,您可以导出完整的预测。

导出完整预测

  1. 在数据集组页面上,单击您在中创建的数据集组Step 1: Import Training Data.

  2. 单击 在屏幕的左上角打开导航窗格。在您的数据集组下,单击Forecasts.

  3. 选择您在Step 3: Create a Forecast中创建的预测旁的单选按钮。

  4. 选择 Create forecast export (创建预测导出)。此时将显示 Create forecast export (创建预测导出) 页面。

  5. Create forecast export (创建预测导出) 页面上,对于 Export details (导出详细信息),提供以下信息。

    • 导出名称— 输入预测导出任务的名称。

    • IAM 角色-保留默认值输入自定义 IAM 角色 ARN.

      或者,您可以选择 Amazon Forecast创建一个新角色从下拉菜单中,按照屏幕上的说明操作。

    • 自定义 IAM 角色 ARN— 输入您在中创建的 IAM 角色的 IAM 角色的 Amazon 资源名称 (ARN)为Amazon Forecast 创建 IAM 角色(IAM 控制台).

    • S3 预测导出地点— 输入存储桶中的Amazon Simple Storage Service (Amazon S3) 存储桶的位置或存储桶中的文件夹:

      s3://<name of your S3 bucket>/<folder path>/

    您的屏幕应类似于以下内容:

  6. 单击启动. 这些区域有:Forecasts将显示页面。

  7. 点击您在中创建的预测Step 3: Create a Forecast. 查找Exast部分。您的屏幕应类似于以下内容:

    您应该可以看到状态进度。等待Amazon Forecast 完成导出预测。此过程可能需要几分钟或更长时间。当您的预测已导出时,状态会转换为 Active (活动),并且您可以在 S3 存储桶中找到预测文件。