Amazon Redshift Spectrum の開始方法 - Amazon Redshift

Amazon Redshift Spectrum の開始方法

このチュートリアルでは、Amazon Redshift Spectrum を使用して Amazon S3 上のファイルのデータに直接クエリを実行する方法を説明します。すでにクラスターと SQL クライアントがある場合、このチュートリアルは最小限のセットアップで完了することができます。

注記

Redshift Spectrum クエリには追加料金が発生します。このチュートリアルのサンプルクエリは通常料金で実行できます。料金の詳細については、「Amazon Redshift Spectrum 料金表」を参照してください。

前提条件

Redshift Spectrum を使用するには、SQL コマンドを実行するために、クラスターに接続された Amazon Redshift クラスターと SQL クライアントが必要です。クラスターと Amazon S3 内のデータファイルは同じ AWS リージョン に存在する必要があります。

Amazon Redshift クラスターの作成方法の詳細については、「Amazon Redshift 入門ガイド」の「Amazon Redshift でプロビジョニングされたクラスター」を参照してください。クラスターに接続する方法については、「Amazon Redshift 入門ガイド」の「Amazon Redshift データウェアハウスに接続する」を参照してください。

次の例では、サンプルデータは米国東部 (バージニア北部)リージョン (us-east-1) にあるため、us-east-1 にあるクラスターも必要です。または、Amazon S3 を使用して、次のバケットとフォルダのデータオブジェクトをクラスターがある AWS リージョン のバケットにコピーできます。

  • s3://redshift-downloads/tickit/spectrum/customers/*

  • s3://redshift-downloads/tickit/spectrum/sales_partition/*

  • s3://redshift-downloads/tickit/spectrum/sales/*

  • s3://redshift-downloads/tickit/spectrum/salesevent/*

次のような Amazon S3 コマンドを実行して、米国東部 (バージニア北部) にあるサンプルデータを AWS リージョン にコピーします。コマンドを実行する前に、Amazon S3 のコピーコマンドに合ったバケットとフォルダをバケットに作成します。Amazon S3 のコピーコマンドの出力により、ファイルが希望する AWS リージョン の bucket-name にコピーされたことが確認されます。

aws s3 cp s3://redshift-downloads/tickit/spectrum/ s3://bucket-name/tickit/spectrum/ --copy-props none --recursive

AWS CloudFormation での Amazon Redshift Spectrum の開始方法

以下に示す手順の代わりに、Redshift Spectrum DataLake の AWS CloudFormation テンプレートにアクセスし、クエリの実行が可能な Amazon S3 バケットを含むスタックを作成することもできます。詳細については、「AWS CloudFormation スタックを起動して Amazon S3 内のデータにクエリを実行する」を参照してください。

ステップバイステップによる Redshift Spectrum の使用開始

Amazon Redshift Spectrum の使用を開始するには、次のステップに従います。