入门 - Amazon Forecast

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

入门

要开始使用 Amazon Forecast,请执行以下操作。

  • 创建Forecast 数据集并导入训练数据。

  • 创建Forecast 变量,使用该预测变量根据时间序列数据生成预测。Forecast 将算法的最佳组合应用于数据集中的每个时间序列。

  • 生成预测。

在本练习中,您将使用公开用电数据集的修改版本来训练预测变量。有关更多信息,请参阅 ElectricityLoadDiagrams20112014 数据集。下面是数据集中的示例行:

2014-01-01 01:00:00, 2.53807106598985, client_0 2014-01-01 01:00:00, 23.648648648648624, client_1 2014-01-01 02:00:00, 9.648648648612345, client_0

在本练习中,您使用数据集训练预测器,然后预测客户每小时的用电量。

您可以使用 Forecast 控制台或AWS Command Line Interface (AWS CLI) 进行本练习。请注意 Amazon Forecast 控制台的默认区域AWS CLI、和 Amazon Forecast SDK,因为 Amazon Forecast 资源不是跨区域共享的。

重要

开始之前,请确保您已经有AWS 账户并且已安装AWS CLI。有关更多信息,请参阅 设置。此外,建议您查看Amazon Forecast 的工作原理

准备输入数据

无论您是使用 Amazon Forecast 控制台还是AWS Command Line Interface (AWS CLI) 来设置预测项目,都需要设置输入数据。要准备数据,请执行以下操作:

  • 将训练数据下载至您的计算机并将其上传至您的计算机中的 Amazon Simple Service(Amazon Simple Service)桶AWS 账户。要将数据导入Amazon Forecast 数据集,您必须将其存储在 Amazon S3 存储桶中。

  • 创建AWS Identity and Access Management(IAM)角色。您授予 Amazon Forecast 权限,允许其使用 IAM 角色访问您的 S3 存储桶。有关 IAM 角色的更多信息,请参阅《IAM 用户指南》中的 IAM 角色

准备训练数据
  1. 下载 zip 文件 electricityusagedata.zip

    在本练习中,您将使用个人家庭用电量数据集的修改版本。(Dua,D. 和 Karra Taniskidou,E.(2017)。 UCI Machine Learning 存储库 [http://archive.ics.uci.edu/ml]。 加利福尼亚州尔湾:加州大学信息与计算机科学学院。) 我们将每小时汇总使用率数据。

  2. 解压缩内容并将其作为 electricityusagedata.csv 保存在本地。

  3. 将数据文件上传到 S3 存储桶。

    有关 step-by-step 说明,请参阅《亚马逊简单存储服务用户指南》中的使用拖放方式上传文件和文件夹

  4. 创建一个 IAM 角色。

    如果您要AWS CLI使用 IAM 角色。如果您使用控制台,则可让它为您创建此角色。有关 step-by-step说明,请参阅为 Amazon Forecast 设置权限

将数据上传到 Amazon S3 后,即可使用 Amazon Forecast 控制台或导入训练数据、创建预测变量、生成预测并查看预测。AWS CLI

清理资源

为避免产生不必要的费用,请删除完成入门练习后创建的资源。要删除资源,请使用 Amazon Forecast 控制台或软件开发工具包中的Delete API 或AWS Command Line Interface (AWS CLI)。例如,使用 DeleteDataset API 来删除数据集。

要删除某个资源,其状态必须为 ACTIVECREATE_FAILEDUPDATE_FAILED。使用 Describe API 检查状态,例如 DescribeDataset

有些资源必须在其他资源之前删除,如下表所示。此过程可能需要一些时间。

要删除您上传的训练数据 electricityusagedata.csv,请参阅如何从 S3 存储桶中删除对象?

要删除的资源 首先删除此项 注意
ForecastExportJob
Forecast 您无法在导出预测时删除预测。删除某个预测后,您将无法再查询该预测。
Predictor 所有关联的预测。
DatasetImportJob 无法删除。
Dataset

所有以数据集为目标的DatasetImportJob都将被删除。

您无法删除预测器使用的 Dataset

DatasetSchema 引用架构的所有数据集。
DatasetGroup

所有关联的预测器

所有关联的预测。

数据集组中的所有数据集。

您无法删除包含预测器使用的 DatasetDatasetGroup