メニュー
Amazon Redshift
データベース開発者ガイド (API Version 2012-12-01)

リモートホストからデータをロードする

COPY コマンドでは、Amazon EC2 インスタンスをはじめとするコンピューターなど、1 つ以上のリモートホストから同時にデータをロードすることができます。COPY では SSH を使用してリモートホストに接続し、リモートホストのコマンドを実行してテキスト出力を生成します。

リモートホストになることができるのは、Amazon EC2 の Linux インスタンスか、SSH 接続を許可するように設定されている Unix コンピューターまたは Linux コンピューターです。このガイドでは、リモートホストが Amazon EC2 インスタンスであることを前提としています。これ以外のコンピューターの場合に手順が異なるときは、その都度説明します。

Amazon Redshift は、複数のホストに接続したうえで、各ホストに対していくつも SSH 接続を確立することができます。Amazon Redshift はそれぞれの接続を介して固有のコマンドを送信し、ホストの標準的な出力先にテキスト出力を生成したうえで、そのテキストファイルを読み取ります。

開始する前に

開始する前に、以下があることを確認してください。

  • 1 台以上のホストマシン (SSH を使用して接続できる Amazon EC2 インスタンスなど)。

  • ホストのデータソース。

    テキスト出力を生成するために Amazon Redshift クラスターがホストで実行するコマンドを指定します。COPY コマンドは、クラスターがホストに接続するとコマンドを実行し、ホストの標準的な出力先からテキストを読み取り、Amazon Redshift テーブルにデータを並列的にロードします。テキストの出力は、COPY コマンドが取り込むことができる形式であることが必要です。詳細については、「入力データを準備する」を参照してください。

  • コンピューターからホストへのアクセス権。

    Amazon EC2 インスタンスでは、ホストにアクセスする際に SSH 接続を使用します。このため、ホストにアクセスし、ホストの承認されたキーファイルに Amazon Redshift クラスターのパブリックキーを追加する必要があります。

  • 実行中の Amazon Redshift クラスター。

    クラスターの起動方法については、Amazon Redshift 入門ガイド を参照してください。

データをロードする手順

このセクションでは、リモートホストからデータをロードする手順を説明します。以下のセクションでは、各ステップで必要な操作の詳細を説明します。