Amazon DynamoDB
開発者ガイド (API バージョン 2012-08-10)

パフォーマンスの調節

DynamoDB にマップする Hive の外部テーブルを作成する場合、DynamoDB で読み取り容量または書き込み容量を消費しません。ただし、Hive テーブルでの読み取りおよび書き込み作業 (INSERTSELECT など) は、基盤となる DynamoDB テーブルでの読み取りおよび書き込みオペレーションに直接変換されます。

Amazon EMR の Apache Hive は DynamoDB テーブルの I/O 負荷のバランスを取るために独自のロジックを導入し、テーブルのプロビジョンドスループットを超過する可能性を最小限に抑えるように努めます。それぞれの Hive クエリの最後に、Amazon EMR はプロビジョンドスループットを超過した回数など、ランタイムメトリクスを返します。この情報に加えて、DynamoDB テーブルの CloudWatch メトリクスを使用して、続くリクエストのパフォーマンスを向上させることができます。

Amazon EMR コンソールでは、クラスターの基本モニタリングツールが用意されています。詳細については、Amazon EMR 管理ガイドの「クラスターを表示し、モニタリングする」を参照してください。

クラスターや Hadoop ジョブは、Hue、Ganglia、Hadoop ウェブインターフェイスなどのウェブベースのツールでモニタリングできます。詳細については、Amazon EMR 管理ガイドの「Amazon EMR クラスターでホストされているウェブインターフェイスの表示」を参照してください。

このセクションでは、外部 DynamoDB テーブルで Hive オペレーションのパフォーマンス調整を行うための手順について説明します。