チュートリアル:Amazon DynamoDB と Apache Hive の使用 - Amazon DynamoDB

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

チュートリアル:Amazon DynamoDB と Apache Hive の使用

このチュートリアルでは、まず、Amazon EMR クラスターを起動した上で、DynamoDB テーブルに格納されているデータの処理に Apache Hive を使用していきます。

Hiveは、Hadoop 用のデータウェアハウスアプリケーションで、複数のソースからのデータを処理および分析することを可能にします。Hive では、SQL に似た言語である HiveQL を使用しながら、ローカルの Amazon EMR クラスター、または外部のデータソース (Amazon DynamoDB など) に保存されたデータを操作できます。

詳細については、「Hive Tutorial」を参照してください。

開始する前に

このチュートリアルでは、以下が必要になります。

  • AWS アカウント。アカウントをお持ちでない場合は、「AWS へのサインアップ」を参照してください。

  • SSH クライアント (セキュアシェル)。SSH クライアントを使用して、Amazon EMR クラスターのリーダーノードに接続し、対話型コマンドを実行します。ほとんどの Linux、Unix、および Mac OS X の実装では、SSH クライアントをデフォルトで利用できます。Windows ユーザーの場合は、SSH がサポートする PuTTY クライアントをダウンロードしてインストールできます。

次のステップ

ステップ1:Amazon EC2 キーペアを作成する