教程:使用 Amazon DynamoDB 和 Apache Hive - Amazon DynamoDB

教程:使用 Amazon DynamoDB 和 Apache Hive

在本教程中,您将启动 Amazon EMR 集群,然后使用 Apache Hive 处理 DynamoDB 表存储的数据。

Hive 是用于 Hadoop 的数据仓库应用程序,用于处理和分析来自多个来源的数据。Hive 提供了类似 SQL 的语言 HiveQL,可用于 Amazon EMR 集群本地存储的数据或外部数据源(如 Amazon DynamoDB)的数据。

有关更多信息,请参见 Hive 教程

开始前的准备工作

在本教程中,您需要以下内容:

  • 一个 AWS 账户。如果没有,请参阅 注册 AWS

  • SSH 客户端 (Secure Shell)。使用 SSH 客户端连接到 Amazon EMR 集群的主节点,运行交互式命令。默认情况下,大多数 Linux、Unix 和 Mac OS X 安装均提供 SSH 客户端。Windows 用户可以下载并安装支持 SSH 的 PuTTY 客户端。

后续步骤

步骤 1:创建 Amazon EC2 密钥对