開始する前に: COPY オプションの設定とデータのロード - AWS Data Pipeline

開始する前に: COPY オプションの設定とデータのロード

AWS Data Pipeline 内で Amazon Redshift にデータをコピーする前に、以下の点を確認します。

  • Amazon S3 からデータをロードします。

  • Amazon Redshift で COPY アクティビティを設定します。

これらのオプションが機能しておりデータのロードが正常に完了したら、これらのオプションを AWS Data Pipeline に転送して、そこでコピーを実行します。

COPY オプションについては、Amazon Redshift データベース開発者ガイドの「COPY」を参照してください。

Amazon S3 からデータをロードする手順については、Amazon Redshift データベース開発者ガイドAmazon S3 からデータをロードするを参照してください。

例えば、Amazon Redshift で以下の SQL コマンドを実行すると、LISTING という名前の新しいテーブルが作成され、Amazon S3 の公開バケットからサンプルデータがコピーされます。

<iam-role-arn> およびリージョンを独自の値に置き換えます。

この例の詳細については、Amazon Redshift 入門ガイドAmazon S3 のサンプルデータをロードするを参照してください。

create table listing( listid integer not null distkey, sellerid integer not null, eventid integer not null, dateid smallint not null sortkey, numtickets smallint not null, priceperticket decimal(8,2), totalprice decimal(8,2), listtime timestamp); copy listing from 's3://awssampledbuswest2/tickit/listings_pipe.txt' credentials 'aws_iam_role=<iam-role-arn>' delimiter '|' region 'us-west-2';