入门 - Amazon Forecast

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

入门

要开始使用 Amazon Forecast,请执行以下操作。

  • 创建 Forecast 数据集并导入训练数据。

  • 创建 Forecast 预测器,您可以使用该预测器根据时间序列数据生成预测。Forecast 将算法的最佳组合应用于数据集中的每个时间序列。

  • 生成预测。

在本练习中,您将使用公开可用的修改后的用电量数据集来训练预测器。有关更多信息,请参阅 ElectricityLoadDiagrams20112014 数据集。下面是数据集中的示例行:

2014-01-01 01:00:00, 2.53807106598985, client_0 2014-01-01 01:00:00, 23.648648648648624, client_1 2014-01-01 02:00:00, 9.648648648612345, client_0

在本练习中,您使用数据集训练预测器,然后预测客户每小时的用电量。

在本练习中,您可以使用 Forecast 控制台或 AWS Command Line Interface(AWS CLI)。请注意 Amazon Forecast 控制台、AWS CLI 和 Amazon Forecast SDK 的默认区域,因为 Amazon Forecast 资源不跨区域共享。

重要

在开始之前,请确保您具有 AWS 账户 并且已安装 AWS CLI。有关更多信息,请参阅设置。此外,建议您查看Amazon Forecast 的工作原理

准备输入数据

无论您使用 Amazon Forecast 控制台还是 AWS Command Line Interface(AWS CLI)来设置预测项目,都需要设置您的输入数据。要准备数据,请执行以下操作:

  • 将训练数据下载至您的电脑,并上传至 AWS 账户 中的 Amazon Simple Storage Service(Amazon S3)存储桶。要将数据导入 Amazon Forecast 数据集,必须将其存储在 Amazon S3 存储桶中。

  • 创建一个 AWS Identity and Access Management(IAM)角色。您向 Amazon Forecast 授予使用 IAM 角色访问您的 S3 存储桶的权限。有关 IAM 角色的更多信息,请参阅《IAM 用户指南》中的 IAM 角色

准备训练数据
  1. 下载 zip 文件 electricityusagedata.zip

    在本练习中,您将使用修改后的单个家庭电力消耗数据集。(Dua, D. 和 Karra Taniskidou, E.(2017).UCI 机器学习存储库 [http://archive.ics.uci.edu/ml]。Irvine, CA:加州大学信息与计算机科学学院。) 我们将每小时汇总使用率数据。

  2. 解压缩内容并将其作为 electricityusagedata.csv 保存在本地。

  3. 将数据文件上传到 S3 存储桶。

    有关分步说明,请参阅 Amazon Simple Storage Service 用户指南中的使用拖放功能上传文件和文件夹

  4. 创建一个 IAM 角色。

    如果要在入门练习中使用 AWS CLI,必须创建一个 IAM 角色。如果您使用控制台,则可让它为您创建此角色。如需分步指导,请参阅 为 Amazon Forecast 设置权限

将数据上传到 Amazon S3 后,您就可以使用 Amazon Forecast 控制台或 AWS CLI 来导入训练数据、创建预测器、生成预测并查看预测了。

清理资源

为避免产生不必要的费用,请删除完成入门练习后创建的资源。要删除资源,请使用 Amazon Forecast 控制台或 SDK 中的 Delete API 或 AWS Command Line Interface(AWS CLI)。例如,使用 DeleteDataset API 来删除数据集。

要删除某个资源,其状态必须为 ACTIVECREATE_FAILEDUPDATE_FAILED。使用 Describe API 检查状态,例如 DescribeDataset

有些资源必须在其他资源之前删除,如下表所示。此过程可能需要一些时间。

要删除您上传的训练数据 electricityusagedata.csv,请参阅如何从 S3 存储桶中删除对象?

要删除的资源 首先删除此项 注意
ForecastExportJob
Forecast 您无法在导出预测时删除预测。删除某个预测后,您将无法再查询该预测。
Predictor 所有关联的预测。
DatasetImportJob 无法删除。
Dataset

所有以数据集为目标的DatasetImportJob都将被删除。

您无法删除预测器使用的 Dataset

DatasetSchema 引用架构的所有数据集。
DatasetGroup

所有关联的预测器

所有关联的预测。

数据集组中的所有数据集。

您无法删除包含预测器使用的 DatasetDatasetGroup