Tutorial: Memuat data dari Amazon S3 - Amazon Redshift

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Tutorial: Memuat data dari Amazon S3

Dalam tutorial ini, Anda berjalan melalui proses memuat data ke dalam tabel database Amazon Redshift Anda dari file data dalam bucket Amazon S3 dari awal hingga akhir.

Dalam tutorial ini, Anda akan melakukan hal-hal berikut:

  • Unduh file data yang menggunakan nilai dipisahkan koma (CSV), dibatasi karakter, dan format lebar tetap.

  • Buat bucket Amazon S3 lalu unggah file data ke bucket.

  • Luncurkan cluster Amazon Redshift dan buat tabel database.

  • Gunakan perintah COPY untuk memuat tabel dari file data di Amazon S3.

  • Memecahkan masalah kesalahan pemuatan dan memodifikasi perintah COPY Anda untuk memperbaiki kesalahan.

Perkiraan waktu: 60 menit

Perkiraan biaya: $1,00 per jam untuk cluster

Prasyarat

Anda membutuhkan prasyarat berikut:

  • AWS Akun untuk meluncurkan cluster Amazon Redshift dan membuat ember di Amazon S3.

  • AWS Kredensi Anda (peran IAM) untuk memuat data pengujian dari Amazon S3. Jika Anda membutuhkan peran IAM baru, buka Membuat peran IAM.

  • Klien SQL seperti editor kueri konsol Amazon Redshift.

Tutorial ini dirancang sedemikian rupa sehingga dapat diambil dengan sendirinya. Selain tutorial ini, kami sarankan untuk menyelesaikan tutorial berikut untuk mendapatkan pemahaman yang lebih lengkap tentang cara merancang dan menggunakan database Amazon Redshift:

Gambaran Umum

Anda dapat menambahkan data ke tabel Amazon Redshift baik dengan menggunakan perintah INSERT atau dengan menggunakan perintah COPY. Pada skala dan kecepatan gudang data Amazon Redshift, perintah COPY berkali-kali lebih cepat dan lebih efisien daripada perintah INSERT.

Perintah COPY menggunakan arsitektur Amazon Redshift massively parallel processing (MPP) untuk membaca dan memuat data secara paralel dari berbagai sumber data. Anda dapat memuat dari file data di Amazon S3, Amazon EMR, atau host jarak jauh apa pun yang dapat diakses melalui koneksi Secure Shell (SSH). Atau Anda dapat memuat langsung dari tabel Amazon DynamoDB.

Dalam tutorial ini, Anda menggunakan perintah COPY untuk memuat data dari Amazon S3. Banyak prinsip yang disajikan di sini berlaku untuk pemuatan dari sumber data lain juga.

Untuk mempelajari lebih lanjut tentang menggunakan perintah COPY, lihat sumber daya ini:

Langkah-langkah