Menggunakan perintah COPY untuk memuat data - Amazon Redshift

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Menggunakan perintah COPY untuk memuat data

Perintah COPY memanfaatkan arsitektur Amazon Redshift massively parallel processing (MPP) untuk membaca dan memuat data secara paralel dari file di Amazon S3, dari tabel DynamoDB, atau dari output teks dari satu atau beberapa host jarak jauh.

catatan

Kami sangat menyarankan menggunakan perintah COPY untuk memuat sejumlah besar data. Menggunakan pernyataan INSERT individu untuk mengisi tabel mungkin sangat lambat. Atau, jika data Anda sudah ada di tabel database Amazon Redshift lainnya, gunakan INSERT INTO... PILIH atau BUAT TABEL AS untuk meningkatkan kinerja. Untuk informasi, lihat INSERT atauBUAT TABEL SEBAGAI.

Untuk memuat data dari AWS sumber daya lain, cluster Anda harus memiliki izin untuk mengakses sumber daya dan melakukan tindakan yang diperlukan.

Untuk memberikan atau mencabut hak istimewa untuk memuat data ke dalam tabel menggunakan perintah COPY, berikan atau cabut hak istimewa INSERT.

Data Anda harus dalam format yang tepat untuk dimuat ke tabel Amazon Redshift Anda. Bagian ini menyajikan panduan untuk mempersiapkan dan memverifikasi data Anda sebelum memuat dan untuk memvalidasi pernyataan COPY sebelum Anda menjalankannya.

Untuk melindungi informasi dalam file Anda, Anda dapat mengenkripsi file data sebelum mengunggahnya ke bucket Amazon S3 Anda; COPY akan mendekripsi data saat melakukan pemuatan. Anda juga dapat membatasi akses ke data pemuatan Anda dengan memberikan kredensil keamanan sementara kepada pengguna. Kredensi keamanan sementara memberikan keamanan yang ditingkatkan karena mereka memiliki rentang hidup yang pendek dan tidak dapat digunakan kembali setelah kedaluwarsa.

Amazon Redshift memiliki fitur bawaan untuk COPY untuk memuat data yang tidak terkompresi dan dibatasi dengan cepat. Tetapi Anda dapat mengompres file Anda menggunakan gzip, lzop, atau bzip2 untuk menghemat waktu mengunggah file.

Jika kata kunci berikut ada dalam kueri COPY, pemisahan otomatis data yang tidak terkompresi tidak didukung: ESCAPE, REMOVEQUOTES, dan FIXEDWIDTH. Tetapi kata kunci CSV didukung.

Untuk membantu menjaga keamanan data Anda saat transit di dalam AWS Cloud, Amazon Redshift menggunakan SSL yang dipercepat perangkat keras untuk berkomunikasi dengan Amazon S3 atau Amazon DynamoDB untuk operasi COPY, UNLOAD, backup, dan restore.

Saat memuat tabel langsung dari tabel Amazon DynamoDB, Anda memiliki opsi untuk mengontrol jumlah throughput yang disediakan Amazon DynamoDB yang Anda konsumsi.

Anda dapat secara opsional membiarkan COPY menganalisis data input Anda dan secara otomatis menerapkan pengkodean kompresi optimal ke tabel Anda sebagai bagian dari proses pemuatan.