開始する前に: COPY オプションの設定とデータのロード
AWS Data Pipeline 内で Amazon Redshift にデータをコピーする前に、以下の点を確認します。
-
Amazon S3 からデータをロードします。
-
Amazon Redshift で
COPY
アクティビティを設定します。
これらのオプションが機能しておりデータのロードが正常に完了したら、これらのオプションを AWS Data Pipeline に転送して、そこでコピーを実行します。
COPY
オプションについては、Amazon Redshift データベース開発者ガイドの「COPY」を参照してください。
Amazon S3 からデータをロードする手順については、Amazon Redshift データベース開発者ガイドの Amazon S3 からデータをロードするを参照してください。
例えば、Amazon Redshift で以下の SQL コマンドを実行すると、LISTING
という名前の新しいテーブルが作成され、Amazon S3 の公開バケットからサンプルデータがコピーされます。
<iam-role-arn>
およびリージョンを独自の値に置き換えます。
この例の詳細については、Amazon Redshift 入門ガイドの Amazon S3 のサンプルデータをロードするを参照してください。
create table listing( listid integer not null distkey, sellerid integer not null, eventid integer not null, dateid smallint not null sortkey, numtickets smallint not null, priceperticket decimal(8,2), totalprice decimal(8,2), listtime timestamp); copy listing from 's3://awssampledbuswest2/tickit/listings_pipe.txt' credentials 'aws_iam_role=<iam-role-arn>' delimiter '|' region 'us-west-2';