入门 - Amazon Forecast

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

入门

要开始使用 Amazon Forecast,请执行以下操作。

  • 创建Forecast 数据集并导入训练数据。

  • 创建预测变量,您可以使用该预测变量根据时间序列数据生成Forecast。Forecast 将算法的最佳组合应用于数据集中的每个时间序列。

  • 生成预测。

在本练习中,您将使用公开发布用电数据集的修改版本来训练预测变量。有关更多信息,请参阅 。ElectricityLoadDiagrams20112014 数据集. 下面是数据集中的示例行:

2014-01-01 01:00:00, 2.53807106598985, client_0 2014-01-01 01:00:00, 23.648648648648624, client_1 2014-01-01 02:00:00, 9.648648648612345, client_0

在本练习中,您使用数据集训练预测器,然后预测客户每小时的用电量。

您可以使用 ForacForecast 控制台或AWS Command Line Interface(AWS CLI) 用于本练习。注意 Amazon Forecast 控制台的默认区域,即AWS CLI和 Amazon Forecast 开发工具包,因为 Amazon Forecast 资源不在区域之间共享。

重要

开始之前,请确保您已经有 AWS 账户并已安装AWS CLI. 有关更多信息,请参阅 设置。此外,建议您查看Amazon Forecast 的工作原理

准备输入数据

无论您使用的是 Amazon Forecast 控制台还是AWS Command Line Interface(AWS CLI) 要设置预测项目,您需要设置输入数据。要准备数据,请执行以下操作:

  • 将训练数据下载至您的计算机并将其上传至您的 AWS 账户中的 Amazon Simple Storage Service (Amazon S3) 存储桶。要导入您的数据导入AAmazon Forecast act 数据集,您必须将其存储在 Amazon S3 存储桶。

  • 创建AWS Identity and Access Management(IAM) 角色。您授予 Amazon Forecast 使用 IAM 角色访问您的 S3 存储桶的权限。有关 IAM 角色的更多信息,请参阅《IAM 用户指南》中的 IAM 角色

准备训练数据

  1. 下载 zip 文件 electricityusagedata.zip

    在本练习中,您将使用个人家庭电力消耗数据集的修改版本。(Dua、D. 和 Karra Taniskidou,E.(2017)。 UCI Machine Learning 存储库 [http://archive.ics.uci.edu/ml]。 加利福尼亚州欧文:加州大学信息与计算机科学学院。) 我们将每小时汇总使用率数据。

  2. 解压缩内容并将其作为 electricityusagedata.csv 保存在本地。

  3. 将数据文件上传到 S3 存储桶。

    对于 step-by-step 说明,请参阅使用拖放功能上传文件和文件夹Amazon Simple Storage Serv

  4. 创建一个 IAM 角色。

    如果要使用AWS CLI必须先创建 IAM 角色,然后才能开始练习。如果您使用控制台,则可让它为您创建此角色。对于 step-by-step说明,请参阅为 Amazon Forecast 设置权限.

将数据上传到 Amazon S3 后,就可以使用 Amazon Forecast 控制台或AWS CLI要导入训练数据,请创建预测变量,生成预测并查看预测。

清理资源

为避免产生不必要的费用,请删除完成入门练习后创建的资源。要删除资源,使用 Amazon Forecast t 控制台或Delete来自软件开发工具包的 API 或AWS Command Line Interface(AWS CLI)。例如,使用 DeleteDataset API 来删除数据集。

要删除某个资源,其状态必须为 ACTIVECREATE_FAILEDUPDATE_FAILED。使用 Describe API 检查状态,例如 DescribeDataset

有些资源必须在其他资源之前删除,如下表所示。此过程可能需要一些时间。

要删除您上传的训练数据 electricityusagedata.csv,请参阅如何从 S3 存储桶中删除对象?

要删除的资源 首先删除此项 注意
ForecastExportJob
Forecast 您无法在导出预测时删除预测。删除某个预测后,您将无法再查询该预测。
Predictor 所有关联的预测。
DatasetImportJob 无法删除。
Dataset

所有以数据集为目标的DatasetImportJob都将被删除。

您无法删除预测器使用的 Dataset

DatasetSchema 引用架构的所有数据集。
DatasetGroup

所有关联的预测器

所有关联的预测。

数据集组中的所有数据集。

您无法删除包含预测器使用的 DatasetDatasetGroup