Amazon S3 からデータをロードする - Amazon Redshift

「翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。」

Amazon S3 からデータをロードする

COPY コマンドは Amazon Redshift の超並列処理 (MPP) アーキテクチャを利用し、Amazon S3 バケットのファイルからデータを並列でロードします。データを複数のファイルに分割し、テーブルに分散キーを設定すれば、並列処理の長所を最大限に活用できます。分散キーの詳細については、「データ分散スタイルの使用」を参照してください。

ファイルからのデータはターゲットテーブルに 1 行ずつロードします。データファイルのフィールドは左から右の順でテーブル列に一致します。データファイルのフィールドは固定幅か文字区切りになります。デフォルトの区切り文字はパイプ (|) です。デフォルトでは、すべてのテーブル列がロードされますが、任意の列のリストをカンマ区切りで指定することもできます。COPY コマンドに指定された列リストに含まれていない列については、デフォルト値がロードされます。詳細については、「デフォルトの列値をロードする」を参照してください。

Amazon S3 からデータをロードするには、次の一般プロセスに従います。

  1. データを複数のファイルに分割します。

  2. ファイルを Amazon S3 にアップロードします。

  3. COPY コマンドを実行し、テーブルをロードします。

  4. データが正しくロードされたことを確認します。

このセクションの残りではこれらのステップについて詳しく説明します。