Langkah 2: Buat EMR cluster Amazon - Amazon Redshift

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Langkah 2: Buat EMR cluster Amazon

COPYPerintah memuat data dari file di Amazon EMR Hadoop Distributed File System ()HDFS. Saat Anda membuat EMR klaster Amazon, konfigurasikan cluster untuk mengeluarkan file data ke clusterHDFS.

Untuk membuat EMR cluster Amazon
  1. Buat EMR klaster Amazon di AWS Wilayah yang sama dengan cluster Amazon Redshift.

    Jika cluster Amazon Redshift berada di aVPC, EMR cluster Amazon harus berada dalam grup yang samaVPC. Jika cluster Amazon Redshift menggunakan mode EC2 -Classic (yaitu, tidak dalam aVPC), EMR cluster Amazon juga harus menggunakan EC2 mode -Classic. Untuk informasi selengkapnya, lihat Mengelola Cluster di Virtual Private Cloud (VPC) di Panduan Manajemen Amazon Redshift.

  2. Konfigurasikan cluster untuk mengeluarkan file data ke clusterHDFS. Nama HDFS file tidak boleh menyertakan tanda bintang (*) atau tanda tanya (?).

    penting

    Nama file tidak boleh menyertakan tanda bintang (*) atau tanda tanya (? ).

  3. Tentukan Tidak untuk opsi Auto-terminate dalam konfigurasi EMR klaster Amazon sehingga cluster tetap tersedia saat COPY perintah berjalan.

    penting

    Jika salah satu file data diubah atau dihapus sebelum COPY selesai, Anda mungkin memiliki hasil yang tidak terduga, atau COPY operasi mungkin gagal.

  4. Perhatikan ID cluster dan public utama DNS (titik akhir untuk EC2 instans Amazon yang menghosting cluster). Anda akan menggunakan informasi itu di langkah selanjutnya.