COPY コマンドを使ってデータをロードする - Amazon Redshift

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

COPY コマンドを使ってデータをロードする

COPY コマンドは Amazon Redshift の超並列処理 (MPP) アーキテクチャを活用し、Amazon S3 のファイル、DynamoDB テーブル、リモートホストから出力されたテキストのいずれかから並列でデータをロードします。

注記

大量のデータをロードする場合、COPY コマンドを使うことをお勧めします。個々に INSERT ステートメントを使ってテーブルにデータを入力すると著しく時間がかかる場合があります。または、他の Amazon Redshift データベーステーブルにデータが既に存在する場合、パフォーマンスを改善するには、INSERT INTO... SELECT または CREATE TABLE AS を使用します。詳細については、「INSERT」または「CREATE TABLE AS」を参照してください。

他の AWS リソースからデータをロードするには、クラスターがリソースにアクセスし、必要なアクションを実行するアクセス権限が必要です。

COPY コマンドを使ってデータをテーブルにロードするための権限を与えるか、取り消すには、INSERT 権限を与えるか、取り消します。

データは、Amazon Redshift テーブルにロードするための適切な形式である必要があります。このセクションでは、ロードする前にデータを準備し、検証するための指針と、COPY ステートメントを実行する前に文を検証するための指針を紹介します。

ファイルの情報を保護するには、Amazon S3 バケットにアップロードする前に暗号化しておきます。COPY を実行すると、ロード時にデータが復号されます。一時的セキュリティ認証情報をユーザーに与えることで、データロードのアクセスを制限することもできます。一時的セキュリティ認証情報はセキュリティを強化します。使用期限が短く、期限が切れた後は再利用できないためです。

gzip、lzop、bzip2 のいずれかを使ってファイルを圧縮し、ファイルのアップロードにかかる時間を短縮できます。その後、COPY を使えば、読み込み時にファイルが解凍され、ロードプロセスが高速化されます。

AWS クラウド内で送信されるデータをセキュリティで保護するために、Amazon Redshift はハードウェアによる SSL を使用して Amazon S3 または Amazon DynamoDB と通信し、コピー、UNLOAD、バックアップ、復旧オペレーションを実行します。

Amazon DynamoDB テーブルからテーブルを直接ロードする場合、消費する Amazon DynamoDB プロビジョニングスループットの量を制御するオプションがあります。

任意で COPY を使い、入力データを分析したり、ロードプロセスの一部として最適な圧縮エンコーディングをテーブルに自動的に適用したりできます。