パフォーマンスチューニング - Amazon DynamoDB

パフォーマンスチューニング

DynamoDB テーブルにマッピングする Hive 外部テーブルを作成しても、DynamoDB からの読み込みまたは書き込み容量は消費されません。ただし、Hive テーブルでの読み込み/書き込みのアクティビティ (INSERT または SELECT など) は、基盤となっている DynamoDB テーブルでの読み込み/書き込みオペレーションとして、直接反映されます。

Amazon EMR の Apache Hive では、DynamoDB テーブルにおける I/O 負荷を分散するための独自のロジックが実装されています。また、テーブルでプロビジョニングされたスループットの超過を、最小限に抑制することが試みられます。Amazon EMR は各 Hive クエリの終了時点で、プロビジョニング済みのスループットが超過された回数を含め、実行時のメトリクスを返します。この情報を DynamoDB テーブルの CloudWatch メトリックスと共に使用することで、後続のリクエストのパフォーマンスを向上することにつなげられます。

Amazon EMR コンソールには、クラスターのモニタリングに関する基本的なツールが用意されています。詳細については、「Amazon EMR 管理ガイド」の「クラスターを表示し、モニタリングする」を参照してください。

また、クラスターと Hadoop のジョブをモニタリングするために、Hue、Ganglia、Hadoop ウェブインターフェイスなどのウェブベースのツールを使用することもできます。詳細については、「Amazon EMR 管理ガイド」の「Amazon EMR クラスターでホストされているウェブインターフェイスの表示」を参照してください。

このセクションでは、外部 DynamoDB テーブルで実行される Hive オペレーションのパフォーマンスを、調整する際に使用できる手順について説明します。