使用命令行复制数据到 Amazon Redshift

本教程演示如何将数据从 Amazon S3 复制到 Amazon Redshift。您将在 Amazon Redshift 中创建一个新表，然后使用 AWS Data Pipeline 将数据从公有 Amazon S3 存储桶传输到此表，该存储桶中包含 CSV 格式的示例输入数据。日志保存到您拥有的 Amazon S3 存储桶。

Amazon S3 是一项 Web 服务，可让您在云中存储数据。有关更多信息，请参阅 Amazon Simple Storage Service 用户指南。Amazon Redshift 是云中的数据仓库服务。有关更多信息，请参阅 Amazon Redshift 管理指南。

先决条件

在开始本教程之前，您必须完成以下步骤：

安装和配置命令行界面（CLI）。有关更多信息，请参阅访问 AWS Data Pipeline。
确保 IAM 角色已命名DataPipelineDefaultRole且DataPipelineDefaultResourceRole存在。 AWS Data Pipeline 控制台会自动为您创建这些角色。如果您一次也没有使用过 AWS Data Pipeline 控制台，则必须手动创建这些角色。有关更多信息，请参阅适用的 IAM 角色 AWS Data Pipeline。
在 Amazon Redshift 中设置 COPY 命令，因为当您在 AWS Data Pipeline中执行复制操作时，需要让这些相同的选项生效。有关信息，请参阅开始之前：配置 COPY 选项并加载数据。
设置 Amazon Redshift 数据库。有关更多信息，请参阅设置管道，创建安全组，并创建 Amazon Redshift 集群。

任务

Javascript 在您的浏览器中被禁用或不可用。

要使用 Amazon Web Services 文档，必须启用 Javascript。请参阅浏览器的帮助页面以了解相关说明。

文档惯例

开始之前：设置管道、安全性和集群

以 JSON 格式定义管道