Buat cluster dengan JupyterHub - Amazon EMR

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Buat cluster dengan JupyterHub

Anda dapat membuat EMR cluster Amazon dengan JupyterHub menggunakan AWS Management Console, AWS Command Line Interface, atau Amazon EMRAPI. Pastikan bahwa klaster tidak dibuat dengan pilihan untuk mengakhiri secara otomatis setelah menyelesaikan langkah-langkah (--auto-terminate pilihan di AWS CLI). Juga, pastikan bahwa administrator dan notebook pengguna dapat mengakses pasangan kunci yang Anda gunakan ketika membuat klaster. Untuk informasi selengkapnya, lihat Menggunakan key pair untuk SSH kredensyal di Panduan EMRManajemen Amazon.

Buat cluster dengan JupyterHub menggunakan konsol

Gunakan prosedur berikut untuk membuat cluster dengan JupyterHub diinstal menggunakan Opsi Lanjutan di EMR konsol Amazon.

Untuk membuat EMR cluster Amazon dengan JupyterHub diinstal menggunakan EMR konsol Amazon
  1. Arahkan ke EMR konsol Amazon baru dan pilih Beralih ke konsol lama dari navigasi samping. Untuk informasi selengkapnya tentang apa yang diharapkan saat beralih ke konsol lama, lihat Menggunakan konsol lama.

  2. Pilih Buat klaster, Buka opsi lanjutan.

  3. Di bawah Konfigurasi Perangkat Lunak:

    • Untuk Rilis, pilih emr-5.36.2, dan pilih. JupyterHub

    • Jika Anda menggunakan Spark, untuk menggunakan AWS Glue Data Catalog sebagai metastore untuk SparkSQL, pilih Gunakan untuk metadata tabel Spark. Untuk informasi selengkapnya, lihat Gunakan Katalog Data AWS Glue sebagai metastore untuk Spark SQL.

    • Untuk Edit pengaturan perangkat lunak pilih Masukkan konfigurasi dan tentukan nilai, atau pilih Muat JSON dari S3 dan tentukan file JSON konfigurasi. Untuk informasi selengkapnya, lihat Mengkonfigurasi JupyterHub.

  4. Di bawah Tambahkan langkah (opsional) konfigurasikan langkah-langkah untuk menjalankan ketika klaster dibuat, pastikan bahwa Penghentian klaster secara otomatis setelah langkah terakhir selesai tidak dipilih, dan pilih Selanjutnya.

  5. Pilih opsi Konfigurasi Perangkat Keras, Selanjutnya. Untuk informasi selengkapnya, lihat Mengonfigurasi perangkat keras dan jaringan cluster di Panduan EMR Manajemen Amazon.

  6. Pilih opsi untuk Pengaturan Klaster Umum, Selanjutnya.

  7. Pilih Opsi Keamanan, menentukan pasangan kunci, dan pilih Buat Klaster.

Buat cluster dengan JupyterHub menggunakan AWS CLI

Untuk meluncurkan cluster dengan JupyterHub, gunakan aws emr create-cluster perintah dan, untuk --applications opsi, tentukanName=JupyterHub. Contoh berikut meluncurkan JupyterHub cluster di Amazon EMR dengan dua EC2 instance (satu master dan satu instance inti). Juga, debugging diaktifkan, dengan log disimpan di lokasi Amazon S3 sebagaimana ditentukan oleh --log-uri. Key pair yang ditentukan menyediakan akses ke EC2 instans Amazon di cluster.

catatan

Karakter lanjutan baris Linux (\) disertakan agar mudah dibaca Karakter ini bisa dihapus atau digunakan dalam perintah Linux. Untuk Windows, hapus atau ganti dengan tanda sisipan (^).

aws emr create-cluster --name="MyJupyterHubCluster" --release-label emr-5.36.2 \ --applications Name=JupyterHub --log-uri s3://MyBucket/MyJupyterClusterLogs \ --use-default-roles --instance-type m5.xlarge --instance-count 2 --ec2-attributes KeyName=MyKeyPair