AWS Data Pipeline tidak lagi tersedia untuk pelanggan baru. Pelanggan yang sudah ada dari AWS Data Pipeline dapat terus menggunakan layanan seperti biasa. Pelajari selengkapnya
Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.
Salin Data ke Amazon Redshift menggunakan Baris Perintah
Tutorial ini menunjukkan cara menyalin data dari Amazon S3 ke Amazon Redshift. Anda akan membuat tabel baru di Amazon Redshift, dan kemudian gunakan AWS Data Pipeline untuk mentransfer data ke tabel ini dari bucket Amazon S3 publik, yang berisi data input sampel dalam format CSV. Log disimpan ke bucket Amazon S3 yang Anda miliki.
Amazon S3 adalah layanan web yang memungkinkan Anda untuk menyimpan data di cloud. Untuk informasi selengkapnya, lihat Panduan Pengguna Amazon Simple Storage Service. Amazon Redshift adalah layanan gudang data di cloud. Untuk informasi selengkapnya, lihat Panduan Manajemen Amazon Redshift.
Prasyarat
Sebelum memulai tutorial ini, Anda harus menyelesaikan langkah berikut:
-
Pasang dan konfigurasi antarmuka baris perintah (CLI). Untuk informasi selengkapnya, lihat Mengakses AWS Data Pipeline.
-
Pastikan bahwa peran IAM bernama DataPipelineDefaultRoledan DataPipelineDefaultResourceRoleada. Konsol AWS Data Pipeline membuat peran ini untuk Anda secara otomatis. Jika Anda belum menggunakan konsol AWS Data Pipeline setidaknya sekali, maka Anda harus membuat peran ini secara manual. Untuk informasi selengkapnya, lihat IAM Role untuk AWS Data Pipeline.
-
Siapkan perintah
COPY
di Amazon Redshift, karena Anda akan perlu memiliki opsi yang sama bekerja ketika Anda melakukan penyalinan dalam AWS Data Pipeline. Untuk informasi, lihat Sebelum Anda Mulai: Mengonfigurasi Opsi COPY dan Beban Data. -
Mengatur basis data Amazon Redshift. Untuk informasi selengkapnya, lihat Mengatur Alur, membuat Grup Keamanan, dan membuat Klaster Amazon Redshift.