COPY dari format data kolumnar - Amazon Redshift

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

COPY dari format data kolumnar

COPY dapat memuat data dari Amazon S3 dalam format kolumnar berikut:

  • ORC

  • Parquet

Untuk contoh menggunakan COPY dari format data kolumnar, lihat. Contoh COPY

COPY mendukung data berformat kolom dengan pertimbangan berikut:

  • Bucket Amazon S3 harus berada di AWS Wilayah yang sama dengan database Amazon Redshift.

  • Untuk mengakses data Amazon S3 Anda melalui titik akhir VPC, siapkan akses menggunakan kebijakan IAM dan peran IAM seperti yang dijelaskan dalam Menggunakan Amazon Redshift Spectrum dengan Perutean VPC yang Ditingkatkan dalam Panduan Manajemen Pergeseran Merah Amazon.

  • COPY tidak secara otomatis menerapkan pengkodean kompresi.

  • Hanya parameter COPY berikut yang didukung:

  • Jika COPY mengalami kesalahan saat memuat, perintah gagal. ACCEPTANYDATE dan MAXERROR tidak didukung untuk tipe data kolumnar.

  • Pesan kesalahan dikirim ke klien SQL. Beberapa kesalahan dicatat di STL_LOAD_ERRORS dan STL_ERROR.

  • COPY menyisipkan nilai ke kolom tabel target dalam urutan yang sama seperti kolom terjadi dalam file data kolumnar. Jumlah kolom dalam tabel target dan jumlah kolom dalam file data harus cocok.

  • Jika file yang Anda tentukan untuk operasi COPY mencakup salah satu ekstensi berikut, kami mendekompresi data tanpa perlu menambahkan parameter apa pun:

    • .gz

    • .snappy

    • .bz2

  • SALIN dari format file Parket dan ORC menggunakan Redshift Spectrum dan akses bucket. Untuk menggunakan COPY untuk format ini, pastikan tidak ada kebijakan IAM yang memblokir penggunaan URL presigned Amazon S3. URL presigned yang dihasilkan oleh Amazon Redshift berlaku selama 1 jam sehingga Amazon Redshift memiliki cukup waktu untuk memuat semua file dari bucket Amazon S3. URL presigned unik dihasilkan untuk setiap file yang dipindai oleh COPY dari format data kolumnar. Untuk kebijakan bucket yang menyertakan s3:signatureAge tindakan, pastikan untuk menetapkan nilainya setidaknya 3.600.000 milidetik. Untuk informasi selengkapnya, lihat Menggunakan Amazon Redshift Spectrum dengan perutean VPC yang disempurnakan.