メニュー
Amazon Redshift
データベース開発者ガイド (API Version 2012年12月1日)

最良のソートキーの選択

Amazon Redshift は、ソートキーに応じたソート順でデータをディスクに格納します。Amazon Redshift クエリオプティマイザは、最適なクエリプランを決定する際にソート順を使用します。

  • 最新のデータが最も頻繁にクエリ処理される場合は、タイムスタンプ列をソートキーの主要な列として指定します。

    クエリは時間範囲外のブロック全体をスキップできるので、効率性が高まります。

  • 1 つの列に対して範囲フィルタリングまたは等価性フィルタリングを頻繁に実行する場合は、その列をソートキーとして指定します。

    Amazon Redshift は、各ブロックに格納された列の最小値と最大値を追跡し、述語範囲に当てはまらないブロックをスキップできるので、その列のブロック全体のデータを読み込む必要がなくなります。

  • テーブルを頻繁に結合する場合は、結合列をソートキーと分散キーの両方として指定します。

    これにより、クエリオプティマイザは、より時間のかかるハッシュ結合ではなくソートマージ結合を選択できるようになります。データが結合キーですでにソートされているので、クエリオプティマイザはソートマージ結合のソートフェーズをバイパスできます。

ソートキーの選択と指定の詳細については、「チュートリアル: テーブル設計のチューニング」と「ソートキーの選択」を参照してください。