メニュー
Amazon Redshift
データベース開発者ガイド (API Version 2012年12月1日)

Amazon S3 からデータをロードする

COPY コマンドは Amazon Redshift の超並列処理 (MPP) アーキテクチャを利用し、Amazon S3 バケットのファイルからデータを並列でロードします。データを複数のファイルに分割し、テーブルに分散キーを設定すれば、並列処理の長所を最大限に活用できます。分散キーの詳細については、「データ分散スタイルの選択」を参照してください。

ファイルからのデータはターゲットテーブルに 1 行ずつロードします。データファイルのフィールドは左から右の順でテーブル列に一致します。データファイルのフィールドは固定幅か文字区切りになります。デフォルトの区切り文字はパイプ (|) です。デフォルトでは、すべてのテーブル列がロードされますが、任意の列のリストをカンマ区切りで指定することもできます。COPY コマンドに指定された列リストに含まれていない列については、デフォルト値がロードされます。詳細については、「デフォルトの列値をロードする」を参照してください。

Amazon S3 からデータをロードするには、次の一般プロセスに従います。

  1. データを複数のファイルに分割します。

  2. ファイルを Amazon S3 にアップロードします。

  3. COPY コマンドを実行し、テーブルをロードします。

  4. データが正しくロードされたことを確認します。

このセクションの残りではこれらのステップについて詳しく説明します。