ステップ 1: サンプルの Amazon Redshift クラスターを作成する - Amazon Redshift

ステップ 1: サンプルの Amazon Redshift クラスターを作成する

このチュートリアルでは、1 つのデータベースを含む Amazon Redshift クラスターを作成する手順について説明します。次に、Amazon S3 からデータベース内のテーブルにデータセットをロードします。このサンプルクラスターは、Amazon Redshift サービスを評価するのに使用できます。

Amazon Redshift クラスターの設定を開始する前に、「AWS へのサインアップ」や「ファイアウォールルールの決定」などの必要な前提条件を必ず完了してください。

別の AWS リソースからデータにアクセスするオペレーションの場合、クラスターには、そのリソースとリソース上のデータに対しユーザーに代わってアクセスするためのアクセス許可が必要です。この場合の例としては、SQL COPY コマンドを使用して Amazon Simple Storage Service (Amazon S3) からデータをロードすることが挙げられます。AWS Identity and Access Management (IAM) を使用してアクセス権限を提供できます。これを行うには、クラスターに対して作成してアタッチした IAM ロールを使用できます。認証情報とアクセス許可の詳細については、「Amazon Redshift データベース開発者ガイド」の「認証情報とアクセス許可」を参照してください。

Amazon Redshift クラスターを作成するには
  1. AWS Management Console にサインインして、 https://console.aws.amazon.com/redshiftv2/で Amazon Redshift コンソールを開きます。

    重要

    IAM ユーザー認証情報を使う場合は、クラスターオペレーションを実行するために必要なアクセス許可を持っていることを確認してください。詳細については、「Amazon Redshift 管理ガイド」の「Amazon Redshift のセキュリティ」を参照してください。

  2. AWS コンソールで、クラスターを作成する先の AWS リージョンを選択します。

  3. ナビゲーションメニューで [Clusters] (クラスター)、[Create cluster] (クラスターを作成) の順に選択します。[クラスターの作成] ページが表示されます。

  4. [Cluster configuration (クラスター構成)] セクションで、[Cluster identifier (クラスター識別子)]、[Node type (ノードタイプ)]、および [Nodes (ノード)] の値を指定します。

    • クラスター識別子: このチュートリアルでは examplecluster を入力します。この識別子は一意である必要があります。識別子は、有効な文字として a~z (小文字のみ) および - (ハイフン) を使って、1~63 文字にする必要があります。

    • クラスターのサイズを設定するには、次のいずれかの方法を選択します。

      注記

      次のステップでは、RA3 ノードタイプをサポートしている AWS リージョンを前提としています。RA3 ノードタイプをサポートする AWS リージョン のリストについては、Amazon Redshift 管理ガイドの「RA3 ノードタイプの概要」を参照してください。各ノードタイプのノード仕様とサイズの詳細については、「ノードタイプの詳細を参照してください」。

      • クラスターのサイズがわからない場合は、[Help me choose (選択ヘルプ)] を選んでください。これにより、データウェアハウスに保存するデータのサイズやクエリ特性について質問するサイジング計算ツールが開きます。

        クラスターの必須サイズ (ノードタイプとノード数) がわかっている場合は、[I'll choose (選択する)] を選んでください。次に、[Node type] (ノードタイプ) と [Nodes] (ノード) の数を選択して、クラスターのサイズを設定します。

        このチュートリアルでは、[ノードタイプ][ra3.4xlarge] を、[ノード数][2] をそれぞれ選択します。

        [AZ 設定] を選択できる場合は、[シングル AZ] を選択します。

      • Amazon Redshift が提供するサンプルデータセットを使用するには、[Sample data] (サンプルデータ) で、[Load sample data] (サンプルデータをロード) をクリックします。Amazon Redshift は、サンプルデータセットの Tickit をデフォルトのdev データベースと public スキーマにロードします。

  5. [データベース設定] セクションで、[管理者ユーザー名] の値を指定します。[管理者パスワード] で、次のオプションから選択します。

    • [パスワードの生成] – Amazon Redshift によって生成されたパスワードを使用します。

    • [管理者パスワードを手動で追加する] – 独自のパスワードを使用します。

    • [AWS Secrets Manager での管理者認証情報の管理] – Amazon Redshift は管理者パスワードの生成と管理に AWS Secrets Manager を使用します。AWS Secrets Manager を使用してパスワードのシークレットの生成と管理を行うには料金がかかります。AWS Secrets Manager の料金の詳細については、「AWS Secrets Manager の料金」を参照してください。

    このチュートリアルでは以下の値を使用します。

    • [管理者ユーザー名]: awsuser を入力します。

    • [管理者ユーザーパスワード]: パスワードの値を入力します。

  6. 以下で説明するように、このチュートリアルでは、 IAM ロールを作成し、そのロールをクラスターのデフォルトとして設定しています。クラスターにデフォルトとして設定できる IAM ロールセットは 1 つのみです。

    1. [Cluster permissions] (クラスターのアクセス許可) にある [Manage IAM roles] (IAM ロールの管理) で、[Create IAM role] (IAM ロールを作成) をクリックします。

    2. 次のいずれかの方法で、 IAM ロールがアクセスする Amazon S3 バケットを指定します。

      • 作成された IAM ロールに対し、redshift という名前の Amazon S3 バケットへのアクセスのみを許可するには、[No additional Amazon S3 bucket] (追加の Amazon S3 バケットはありません) を選択します。

      • 作成された IAM ロールが、すべての Amazon S3 バケットにアクセスできるようにするには、[Any Amazon S3 bucket] (すべての Amazon S3 バケット) を選択します。

      • 作成された IAM ロールがアクセスする 1 つ以上の Amazon S3 バケットを指定するには、[Specific Amazon S3 buckets] (特定の Amazon S3 バケット) を選択します 次に、テーブルから Amazon S3 バケットを 1 つ以上選択します。

    3. [Create IAM role as default] (デフォルトとして IAM ロールを作成する) をクリックします。Amazon Redshift は、クラスター用に IAM ロールを自動的に作成し、デフォルトとして設定します。

      コンソールから IAM ロールを作成したため、IAM ロールには AmazonRedshiftAllCommandsFullAccess ポリシーがアタッチされています。これにより Amazon Redshift は、IAM アカウント内の Amazon リソースからのデータのコピーやロード、そのデータに対するクエリおよび分析の実行が可能になります。

    クラスターのデフォルトの IAM ロールを管理する詳しい方法については、「Amazon Redshift 管理ガイド」の「Amazon Redshift 用にデフォルトの IAM ロールを作成する」を参照してください。

  7. (オプション) [Additional configurations] (追加設定) セクションで、[Use defaults] (デフォルトを使用) をオフにして、[Network and security] (ネットワークとセキュリティ)、[Database configurations] (データベース設定)、[Maintenance] (メンテナンス)、[Monitoring] (モニタリング)、および [Backup] (バックアップ) 設定を変更します。

    場合によっては、[Load sample data] (サンプルデータをロード) を使用してクラスターを作成し、拡張 Amazon VPC ルーティングを有効すること考えられます。その場合、仮想プライベートクラウド (VPC) のクラスターは Amazon S3 エンドポイントにアクセスし、データをロードする必要があります。

    クラスターをパブリックにアクセスできるようにするには、以下の 2 つのうちいずれかを実行します。クラスターがインターネットにアクセスできるように、ネットワークアドレス変換 (NAT) アドレスを VPC 内で設定します。または、VPC で Amazon S3 VPC エンドポイントを設定します。拡張された Amazon VPC ルーティングの詳細については、「Amazon Redshift 管理ガイド」の「拡張された Amazon VPC ルーティングをオンにする」を参照してください。

  8. [クラスターを作成] を選択します。[クラスター] ページでクラスターが作成され、ステータスが [Available] になるまで待ちます。