ステップ 1: サンプルの Amazon Redshift クラスターを作成する - Amazon Redshift

ステップ 1: サンプルの Amazon Redshift クラスターを作成する

別の AWS リソースからデータにアクセスするオペレーションの場合、クラスターには、そのリソースとリソース上のデータに対しユーザーに代わってアクセスするためのアクセス許可が必要です。この場合の例としては、COPY コマンドを使用して Amazon Simple Storage Service (Amazon S3) からデータをロードすることが挙げられます。AWS Identity and Access Management (IAM) を使用してアクセス権限を提供できます。クラスターにアタッチされている IAM ロールを通してこれを行うことができます。または、必要な許可を持つ IAM ユーザーに対し、AWS アクセスキーを提供することもできます。認証情報とアクセス許可の詳細については、「認証情報とアクセス許可」を参照してください。

機密データおよび AWS のアクセス認証情報を最良の状態で保護するためには、IAM ロールを作成し、自分のクラスターにアタッチすることをお勧めします。アクセス許可の提供の詳細については、「Permissions to access other AWS resources」を参照してください。

ここで作成するクラスターはライブであり、サンドボックスでは実行されません。クラスターを削除するまで、そのクラスターについて Amazon Redshift 標準使用料が発生します。ここで説明したチュートリアルを 1 種類の設定だけで実行し、完了した時点でクラスターを削除すれば、課金される合計料金はごくわずかです。

Amazon Redshift クラスターを作成するには

  1. AWS Management Console にサインインして、(https://console.aws.amazon.com/redshift/)でAmazon Redshift コンソール を開きます。

    重要

    IAM ユーザー認証情報を使う場合は、クラスターオペレーションを実行するために必要なアクセス許可を持っていることを確認してください。詳細については、「Amazon Redshift 管理ガイド」の「IAM ユーザーへのアクセスの制御」を参照してください。

  2. 画面右上で、クラスターを作成する AWS リージョン を選択します。

  3. ナビゲーションメニューで [Clusters] (クラスター)、[Create cluster] (クラスターの作成) の順に選択します。[クラスターの作成] ページが表示されます。

  4. [Cluster configuration (クラスター構成)] セクションで、[Cluster identifier (クラスター識別子)]、[Node type (ノードタイプ)]、および [Nodes (ノード)] の値を指定します。

    • クラスター識別子: このチュートリアルでは examplecluster を入力します。この識別子は一意である必要があります。識別子は、有効な文字として a~z (小文字のみ) および - (ハイフン) を使って、1~63 文字にする必要があります。

    • クラスターのサイズを設定するには、次のいずれかの方法を選択します。

      注記

      以下のステップでは、AWS リージョンにおいて RA3 ノードタイプがサポートされていることを想定しています。RA3 ノードタイプをサポートする AWS リージョンのリストについては、「Amazon Redshift 管理ガイド」の「RA3 ノードタイプの概要」を参照してください。

      • AWS リージョンが RA3 ノードタイプをサポートしている場合は、[このクラスターを何に使用する予定ですか?] の項目から、[本番稼働用] または [無料トライアル] のいずれかを選択してださい

        組織が適格であれば、Amazon Redshift 無料トライアルプログラムの下でクラスターを作成できる場合があります。無料トライアルプログラムを使用したクラスターの作成の詳細については、「サンプルデータセットを使用する」を参照してください。これを行うには、[Free trial (無料トライアル)] を選択して、dc2.large ノードタイプの設定を作成します。無料トライアルの選択に関する詳細については、Amazon Redshift 無料トライアルを参照してください。

      • クラスターのサイズがわからない場合は、[Help me choose (選択ヘルプ)] を選んでください。これにより、データウェアハウスに保存する予定のデータのサイズとクエリの特性について質問するサイジング計算ツールが起動されます。

        クラスターの必須サイズ (ノードタイプとノード数) がわかっている場合は、[I'll choose (選択する)] を選んでください。次に、ノードの種類ノードの数量を選択して、概念実証のためにクラスターのサイズを設定します。

    • このチュートリアルでは、[Node type] (ノードタイプ) に [dc2.large] を、[Nodes] (ノード数) に [2] をそれぞれ選択します。

    • [本番稼働用] クラスター選択した場合は、次のいずれかの操作を行います。

      • Amazon Redshift が提供するサンプルデータセットを使用するには、[Sample data] (サンプルデータ) で、[Load sample data] (サンプルデータをロード) をクリックします。Amazon Redshift は、サンプルデータセットの Tickit をデフォルトのdev データベースと public スキーマにロードします。

      • 独自のデータを Amazon Redshift に導入する場合は、このチュートリアルで以降の部分に進みます。

  5. [データベース設定] セクションで、[データベース名 (オプション)]、[データベースポート (オプション)]、[管理者ユーザー名]、[管理ユーザーのパスワード] の値をそれぞれ指定します。または、パスワードの生成を選択して、Amazon Redshift によって生成されたパスワードを使用します。

    このチュートリアルでは以下の値を使用します。

    • データベース名 (オプション): dev と入力します。

    • データベースポート (オプション): 5439 と入力します。

    • [管理者ユーザー名]: awsuser を入力します。

    • [管理者ユーザーパスワード]: パスワードの値を入力します。

  6. 以下で説明するように、このチュートリアルでは、 IAM ロールを作成し、そのロールをクラスターのデフォルトとして設定しています。クラスターにデフォルトとして設定できる IAM ロールセットは 1 つのみです。

    1. [Cluster permissions] (クラスターのアクセス許可) にある [Manage IAM roles] (IAM ロールの管理) で、[Create IAM role] (IAM ロールを作成) をクリックします。

    2. 次のいずれかの方法で、 IAM ロールがアクセスする Amazon S3 バケットを指定します。

      • 作成された IAM ロールに対し、redshift という名前の Amazon S3 バケットへのアクセスのみを許可するには、[No additional Amazon S3 bucket] (追加の Amazon S3 バケットはありません) を選択します。

      • 作成された IAM ロールが、すべての Amazon S3 バケットにアクセスできるようにするには、[Any Amazon S3 bucket] (すべての Amazon S3 バケット) を選択します。

      • 作成された IAM ロールがアクセスする 1 つ以上の Amazon S3 バケットを指定するには、[Specific Amazon S3 buckets] (特定の Amazon S3 バケット) を選択します 次に、テーブルから Amazon S3 バケットを 1 つ以上選択します。

    3. [Create IAM role as default] (デフォルトとして IAM ロールを作成する) をクリックします。Amazon Redshift は、クラスター用に IAM ロールを自動的に作成し、デフォルトとして設定します。

      コンソールから IAM ロールを作成したため、IAM ロールには AmazonRedshiftAllCommandsFullAccess ポリシーがアタッチされています。これにより Amazon Redshift は、IAM アカウント内の Amazon リソースからのデータのコピーやロード、そのデータに対するクエリおよび分析の実行が可能になります。

    クラスターのデフォルト IAM ロールを管理する方法については、「Amazon Redshift 用にデフォルトの IAM ロールを作成する」を参照してください。

  7. (オプション) [Additional configurations] (追加設定) セクションで、[Use defaults] (デフォルトを使用) をオフにして、[Network and security] (ネットワークとセキュリティ)、[Database configurations] (データベース設定)、[Maintenance] (メンテナンス)、[Monitoring] (モニタリング)、および [Backup] (バックアップ) 設定を変更します。

    場合によっては、[Load sample data] (サンプルデータをロード) を使用してクラスターを作成し、拡張 Amazon VPC ルーティングを有効すること考えられます。その場合、仮想プライベートクラウド (VPC) のクラスターは Amazon S3 エンドポイントにアクセスし、データをロードする必要があります。

    クラスターをパブリックにアクセスできるようにするには、以下の 2 つのうちいずれかを実行します。クラスターがインターネットにアクセスできるように、ネットワークアドレス変換 (NAT) アドレスを VPC 内で設定します。または、VPC で Amazon S3 VPC エンドポイントを設定します。拡張された Amazon VPC ルーティングの詳細については、「Amazon Redshift 管理ガイド」の「Amazon VPC ルーティングの拡張を有効にする」を参照してください。

  8. [Create cluster] (クラスターを作成) を選択します。