本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
入门
要开始使用 Amazon Forecast,请执行以下操作。
-
创建 Forecast 数据集并导入训练数据。
-
创建 Forecast 预测器,您可以使用该预测器根据时间序列数据生成预测。Forecast 将算法的最佳组合应用于数据集中的每个时间序列。
-
生成预测。
在本练习中,您将使用公开可用的修改后的用电量数据集来训练预测器。有关更多信息,请参阅 ElectricityLoadDiagrams20112014 数据集
2014-01-01 01:00:00, 2.53807106598985, client_0 2014-01-01 01:00:00, 23.648648648648624, client_1 2014-01-01 02:00:00, 9.648648648612345, client_0
在本练习中,您使用数据集训练预测器,然后预测客户每小时的用电量。
在本练习中,您可以使用 Forecast 控制台或 AWS Command Line Interface(AWS CLI)。请注意 Amazon Forecast 控制台、AWS CLI 和 Amazon Forecast SDK 的默认区域,因为 Amazon Forecast 资源不跨区域共享。
重要
在开始之前,请确保您具有 AWS 账户 并且已安装 AWS CLI。有关更多信息,请参阅设置。此外,建议您查看Amazon Forecast 的工作原理。
准备输入数据
无论您使用 Amazon Forecast 控制台还是 AWS Command Line Interface(AWS CLI)来设置预测项目,都需要设置您的输入数据。要准备数据,请执行以下操作:
-
将训练数据下载至您的电脑,并上传至 AWS 账户 中的 Amazon Simple Storage Service(Amazon S3)存储桶。要将数据导入 Amazon Forecast 数据集,必须将其存储在 Amazon S3 存储桶中。
-
创建一个 AWS Identity and Access Management(IAM)角色。您向 Amazon Forecast 授予使用 IAM 角色访问您的 S3 存储桶的权限。有关 IAM 角色的更多信息,请参阅《IAM 用户指南》中的 IAM 角色。
准备训练数据
-
下载 zip 文件 electricityusagedata.zip。
在本练习中,您将使用修改后的单个家庭电力消耗数据集。(Dua, D. 和 Karra Taniskidou, E.(2017).UCI 机器学习存储库 [http://archive.ics.uci.edu/ml
]。Irvine, CA:加州大学信息与计算机科学学院。) 我们将每小时汇总使用率数据。 -
解压缩内容并将其作为
electricityusagedata.csv
保存在本地。 -
将数据文件上传到 S3 存储桶。
有关分步说明,请参阅 Amazon Simple Storage Service 用户指南中的使用拖放功能上传文件和文件夹。
-
创建一个 IAM 角色。
如果要在入门练习中使用 AWS CLI,必须创建一个 IAM 角色。如果您使用控制台,则可让它为您创建此角色。如需分步指导,请参阅 为 Amazon Forecast 设置权限。
将数据上传到 Amazon S3 后,您就可以使用 Amazon Forecast 控制台或 AWS CLI 来导入训练数据、创建预测器、生成预测并查看预测了。
清理资源
为避免产生不必要的费用,请删除完成入门练习后创建的资源。要删除资源,请使用 Amazon Forecast 控制台或 SDK 中的 Delete
API 或 AWS Command Line Interface(AWS CLI)。例如,使用 DeleteDataset API 来删除数据集。
要删除某个资源,其状态必须为 ACTIVE
、CREATE_FAILED
或 UPDATE_FAILED
。使用 Describe
API 检查状态,例如 DescribeDataset。
有些资源必须在其他资源之前删除,如下表所示。此过程可能需要一些时间。
要删除您上传的训练数据 electricityusagedata.csv
,请参阅如何从 S3 存储桶中删除对象?。
要删除的资源 | 首先删除此项 | 注意 |
---|---|---|
ForecastExportJob |
||
Forecast |
您无法在导出预测时删除预测。删除某个预测后,您将无法再查询该预测。 | |
Predictor |
所有关联的预测。 | |
DatasetImportJob |
无法删除。 | |
Dataset |
所有以数据集为目标的 您无法删除预测器使用的 |
|
DatasetSchema |
引用架构的所有数据集。 | |
DatasetGroup |
所有关联的预测器 所有关联的预测。数据集组中的所有数据集。 |
您无法删除包含预测器使用的 |