Langkah 4: Muat data dari Amazon S3 ke Amazon Redshift - Amazon Redshift

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Langkah 4: Muat data dari Amazon S3 ke Amazon Redshift

Setelah membuat cluster, Anda dapat memuat data dari Amazon S3 ke tabel database Anda. Ada beberapa cara untuk memuat data dari Amazon S3.

  • Anda dapat menggunakan klien SQL untuk menjalankan perintah SQL CREATE TABLE untuk membuat tabel di database Anda dan kemudian menggunakan perintah SQL COPY untuk memuat data dari Amazon S3. Editor kueri Amazon Redshift v2 adalah klien SQL.

  • Anda dapat menggunakan wizard pemuatan Amazon Redshift query editor v2.

Tutorial ini pertama kali menunjukkan cara menggunakan Amazon Redshift query editor v2 untuk menjalankan perintah SQL untuk CREATE tabel dan COPY data. Luncurkan Query editor v2 dari panel navigasi konsol Amazon Redshift. Dalam query editor v2 buat koneksi ke examplecluster cluster dan database bernama dev dengan pengguna admin Andaawsuser. Untuk tutorial ini pilih Kredensi sementara menggunakan nama pengguna database saat Anda membuat koneksi. Untuk detail tentang menggunakan editor kueri Amazon Redshift v2, lihat Menyambungkan ke database Amazon Redshift di Panduan Manajemen Pergeseran Merah Amazon.

Memuat data dari Amazon S3 menggunakan perintah SQL

Pada panel editor kueri editor kueri v2, konfirmasikan bahwa Anda terhubung ke examplecluster cluster dan dev database. Selanjutnya, buat tabel dalam database dan muat data ke tabel. Untuk tutorial ini, data yang Anda muat tersedia di bucket Amazon S3 yang dapat diakses dari banyak orang. Wilayah AWS

Prosedur berikut membuat tabel dan memuat data dari bucket Amazon S3 publik.

Gunakan Amazon Redshift query editor v2 untuk menyalin dan menjalankan pernyataan create table berikut untuk membuat tabel dalam public skema database. dev Untuk informasi selengkapnya tentang sintaks, lihat MEMBUAT TABEL di Panduan Pengembang Database Amazon Redshift.

Untuk membuat dan memuat data menggunakan klien SQL seperti editor kueri v2
  1. Jalankan perintah SQL berikut untuk CREATE sales tabel.

    drop table if exists sales; create table sales( salesid integer not null, listid integer not null distkey, sellerid integer not null, buyerid integer not null, eventid integer not null, dateid smallint not null sortkey, qtysold smallint not null, pricepaid decimal(8,2), commission decimal(8,2), saletime timestamp);
  2. Jalankan perintah SQL berikut untuk CREATE date tabel.

    drop table if exists date; create table date( dateid smallint not null distkey sortkey, caldate date not null, day character(3) not null, week smallint not null, month character(5) not null, qtr character(5) not null, year smallint not null, holiday boolean default('N'));
  3. Muat sales tabel dari Amazon S3 menggunakan perintah COPY.

    catatan

    Sebaiknya gunakan perintah COPY untuk memuat kumpulan data besar ke Amazon Redshift dari Amazon S3. Untuk informasi selengkapnya tentang sintaks COPY, lihat COPY di Panduan Pengembang Database Amazon Redshift.

    Berikan autentikasi untuk klaster Anda untuk mengakses Amazon S3 atas nama Anda untuk memuat data sampel. Anda memberikan autentikasi dengan mereferensikan peran IAM yang Anda buat dan tetapkan sebagai klaster saat Anda memilih Create IAM role sebagai default saat Anda membuat klaster. default

    Muat sales tabel menggunakan perintah SQL berikut. Anda secara opsional dapat mengunduh dan melihat dari Amazon S3 data sumber untuk sales tabel. .

    COPY sales FROM 's3://redshift-downloads/tickit/sales_tab.txt' DELIMITER '\t' TIMEFORMAT 'MM/DD/YYYY HH:MI:SS' REGION 'us-east-1' IAM_ROLE default;
  4. Muat date tabel menggunakan perintah SQL berikut. Anda secara opsional dapat mengunduh dan melihat dari Amazon S3 data sumber untuk date tabel. .

    COPY date FROM 's3://redshift-downloads/tickit/date2008_pipe.txt' DELIMITER '|' REGION 'us-east-1' IAM_ROLE default;

Memuat data dari Amazon S3 menggunakan editor kueri v2

Editor kueri v2 menyederhanakan pemuatan data saat menggunakan wizard Load data. Perintah COPY yang dihasilkan dan digunakan dalam editor kueri v2 Load data wizard mendukung banyak parameter yang tersedia untuk sintaks perintah COPY untuk memuat data dari Amazon S3. Untuk informasi tentang perintah COPY dan opsinya yang digunakan untuk menyalin beban dari Amazon S3, lihat COPY dari Amazon Simple Storage Service di Panduan Pengembang Database Amazon Redshift.

Untuk memuat data Anda sendiri dari Amazon S3 ke Amazon Redshift, Amazon Redshift memerlukan peran IAM yang memiliki hak istimewa yang diperlukan untuk memuat data dari bucket Amazon S3 yang ditentukan.

Untuk tutorial ini, pertama buka Amazon Redshift query editor v2 dan sambungkan ke database. Selanjutnya, buat tabel yang akan berisi data yang dimuat. Kemudian muat data Anda sendiri dari Amazon S3 ke Amazon Redshift. Untuk informasi selengkapnya tentang cara bekerja dengan editor kueri v2, lihat Memuat data ke dalam database di Panduan Manajemen Pergeseran Merah Amazon.

Membuat data TICKIT di klaster Anda

Anda dapat membuat set lengkap tabel TICKIT dan memuat data ke dalam klaster Anda dengan cara berikut:

  • Saat membuat cluster di konsol Amazon Redshift, Anda memiliki opsi untuk memuat data TICKIT sampel secara bersamaan. Di konsol Amazon Redshift, pilih Clusters, Create cluster. Di bagian Data sampel, pilih Muat data sampel Amazon Redshift memuat kumpulan data sampelnya ke dev database cluster Amazon Redshift Anda secara otomatis selama pembuatan klaster.

  • Dengan editor kueri Amazon Redshift v2, Anda dapat memuat data TICKIT ke dalam database sampel bernama sample_data_dev. Arahkan ke database sample_data_dev, lalu ke tickit, dan dari menu konteks pilih Buka contoh buku catatan. Editor kueri Amazon Redshift v2 membuat database sampel bersama dengan notebook contoh bernama tickit-sample-notebook. Anda dapat menjalankan buku catatan ini untuk melakukan kueri data dalam database sampel.

Untuk melihat detail tentang data TICKIT, lihat Contoh database di Panduan Pengembang Database Amazon Redshift.