Amazon Redshift Spectrum の開始方法
このチュートリアルでは、Amazon Redshift Spectrum を使用して Amazon S3 上のファイルのデータに直接クエリを実行する方法を説明します。すでにクラスターと SQL クライアントがある場合、このチュートリアルは最小限のセットアップで完了することができます。
注記
Redshift Spectrum クエリには追加料金が発生します。このチュートリアルのサンプルクエリは通常料金で実行できます。料金の詳細については、「Amazon Redshift Spectrum 料金表
前提条件
Redshift Spectrum を使用するには、SQL コマンドを実行するために、クラスターに接続された Amazon Redshift クラスターと SQL クライアントが必要です。クラスターと Amazon S3 内のデータファイルは同じ AWS リージョン に存在する必要があります。
Amazon Redshift クラスターの作成方法の詳細については、「Amazon Redshift 入門ガイド」の「Amazon Redshift でプロビジョニングされたクラスター」を参照してください。クラスターに接続する方法については、「Amazon Redshift 入門ガイド」の「Amazon Redshift データウェアハウスに接続する」を参照してください。
次の例では、サンプルデータは米国東部 (バージニア北部)リージョン (us-east-1
) にあるため、us-east-1
にあるクラスターも必要です。または、Amazon S3 を使用して、次のバケットとフォルダのデータオブジェクトをクラスターがある AWS リージョン のバケットにコピーできます。
s3://redshift-downloads/tickit/spectrum/customers/*
s3://redshift-downloads/tickit/spectrum/sales_partition/*
s3://redshift-downloads/tickit/spectrum/sales/*
s3://redshift-downloads/tickit/spectrum/salesevent/*
次のような Amazon S3 コマンドを実行して、米国東部 (バージニア北部) にあるサンプルデータを AWS リージョン にコピーします。コマンドを実行する前に、Amazon S3 のコピーコマンドに合ったバケットとフォルダをバケットに作成します。Amazon S3 のコピーコマンドの出力により、ファイルが希望する AWS リージョン の bucket-name
にコピーされたことが確認されます。
aws s3 cp s3://redshift-downloads/tickit/spectrum/ s3://
bucket-name
/tickit/spectrum/ --copy-props none --recursive
AWS CloudFormation での Amazon Redshift Spectrum の開始方法
以下に示す手順の代わりに、Redshift Spectrum DataLake の AWS CloudFormation テンプレートにアクセスし、クエリの実行が可能な Amazon S3 バケットを含むスタックを作成することもできます。詳細については、「AWS CloudFormation スタックを起動して Amazon S3 内のデータにクエリを実行する」を参照してください。
ステップバイステップによる Redshift Spectrum の使用開始
Amazon Redshift Spectrum の使用を開始するには、次のステップに従います。