Salin Data ke Amazon Redshift menggunakan Baris Perintah

Tutorial ini menunjukkan cara menyalin data dari Amazon S3 ke Amazon Redshift. Anda akan membuat tabel baru di Amazon Redshift, dan kemudian gunakan AWS Data Pipeline untuk mentransfer data ke tabel ini dari bucket Amazon S3 publik, yang berisi data input sampel dalam format CSV. Log disimpan ke bucket Amazon S3 yang Anda miliki.

Amazon S3 adalah layanan web yang memungkinkan Anda untuk menyimpan data di cloud. Untuk informasi selengkapnya, lihat Panduan Pengguna Amazon Simple Storage Service. Amazon Redshift adalah layanan gudang data di cloud. Untuk informasi selengkapnya, lihat Panduan Manajemen Amazon Redshift.

Prasyarat

Sebelum memulai tutorial ini, Anda harus menyelesaikan langkah berikut:

Pasang dan konfigurasi antarmuka baris perintah (CLI). Untuk informasi selengkapnya, lihat Mengakses AWS Data Pipeline.
Pastikan bahwa peran IAM bernama DataPipelineDefaultRoledan DataPipelineDefaultResourceRoleada. AWS Data Pipeline Konsol membuat peran ini untuk Anda secara otomatis. Jika Anda belum menggunakan AWS Data Pipeline konsol setidaknya sekali, maka Anda harus membuat peran ini secara manual. Untuk informasi selengkapnya, lihat Peran IAM untuk AWS Data Pipeline.
Siapkan perintah COPY di Amazon Redshift, karena Anda akan perlu memiliki opsi yang sama bekerja ketika Anda melakukan penyalinan dalam AWS Data Pipeline. Untuk informasi, lihat Sebelum Anda Mulai: Mengonfigurasi Opsi COPY dan Beban Data.
Mengatur basis data Amazon Redshift. Untuk informasi selengkapnya, lihat Mengatur Alur, membuat Grup Keamanan, dan membuat Klaster Amazon Redshift.

Tugas

Awas Javascript dinonaktifkan atau tidak tersedia di browser Anda.

Untuk menggunakan Dokumentasi AWS, Javascript harus diaktifkan. Lihat halaman Bantuan browser Anda untuk petunjuk.

Konvensi Dokumen

Sebelum Anda Mulai: Mengatur Alur, Keamanan, dan Klaster

Definisikan Alur di Format JSON