データのロード - Amazon Redshift

データのロード

COPY コマンドは、テーブルをロードする最も効率的な方法です。INSERT コマンドを使ってデータをテーブルに追加することもできます。ただし、COPY コマンドを使ったほうが効率的です。COPY コマンドは、複数のデータファイルまたは複数のデータストリームから同時に読み込むことができます。Amazon Redshift はワークロードをクラスターノードに割り当て、行のソートおよびノードスライス間でのデータディストリビューションを含む、ロードオペレーションを並列で実行します。

注記

Amazon Redshift Spectrum の外部テーブルは読み込み専用です。外部テーブルには COPY または INSERT できません。

他の AWS リソースのデータにアクセスする場合、クラスターにはそのリソースにアクセスし、データ処理のアクションを実行するためのアクセス許可が必要です。AWS Identity and Access Management (IAM) を使用し、クラスターのリソースとデータへのユーザーのアクセスを制限します。

初回のデータロードの後、大量のデータを追加、変更、削除した場合、VACUUM コマンドを実行してデータを再編成し、削除後の領域を利用可能な状態に戻してください。また、ANALYZE コマンドを実行し、テーブル統計を更新します。

このセクションでは、データのロード方法とデータロードのトラブルシューティング方法を説明し、データロードのベストプラクティスを紹介します。