Amazon Redshift
データベース開発者ガイド

ロードデータの複数のファイルへの分割

COPY コマンドは、複数のファイルから同時にデータをロードして、クラスターのノード間でワークロードを分散します。1 つの大容量ファイルからすべてのデータをロードする場合、Amazon Redshift は低速なシリアル化されたロードを実行します。ロードデータファイルを分割して大体同じサイズにし、圧縮後に 1 MB ~ 1 GB になるようにします。並列処理にとって最適なサイズは、圧縮後で 1 MB から 125 MB の間です。ファイルの数はクラスター内のスライスの数の倍数である必要があります。データをファイルに分割する方法と COPY を使ってデータをロードする例の詳細については、「Amazon S3 からデータをロードする」を参照してください。