Bekerja dengan EMR Notebook - Amazon EMR

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Bekerja dengan EMR Notebook

catatan

EMRNotebook tersedia sebagai Ruang Kerja EMR Studio di konsol. Tombol Create Workspace di konsol memungkinkan Anda membuat notebook baru. Untuk mengakses atau membuat Ruang Kerja, pengguna EMR Notebook memerlukan izin IAM peran tambahan. Untuk informasi selengkapnya, lihat EMRNotebook Amazon adalah Amazon EMR Studio Workspaces di konsol dan konsol Amazon EMR.

Setelah Anda membuat EMR buku catatan, notebook membutuhkan waktu singkat untuk memulai. Status di daftar Notebook menunjukkan Memulai. Anda bisa membuka notebook saat statusnya Siap. Mungkin butuh waktu sedikit lebih lama untuk notebook menjadi Siap jika Anda membuat sebuah klaster bersama dengannya.

Tip

Refresh browser Anda atau pilih ikon refresh di atas daftar notebook untuk menyegarkan status notebook.

Memahami status Notebook

EMRNotebook dapat memiliki status berikut dalam daftar Notebook.

Status Arti

Siap

Anda bisa membuka notebook menggunakan editor notebook. Sementara notebook memiliki status Siap, Anda dapat menghentikan atau menghapusnya. Untuk mengganti klaster, Anda harus menghentikan notebook terlebih dahulu. Jika notebook di status Siap idle untuk jangka waktu yang lama, notebook dihentikan secara otomatis.

Mulai

Notebook sedang dibuat dan ditempelkan ke klaster. Saat notebook dimulai, Anda tidak dapat membuka editor notebook, menghentikannya, menghapusnya, atau mengubah klaster.

Tertunda

Notebook telah dibuat, dan sedang menunggu integrasi dengan klaster selesai. Klaster mungkin masih menyediakan sumber daya atau menanggapi permintaan lainnya. Anda bisa membuka editor notebook dengan notebook dalam mode lokal. Kode apa pun yang bergantung pada proses klaster tidak mengeksekusi dan gagal.

Berhenti

Notebook dimatikan, atau klaster yang ditempelkan pada notebook berakhir. Saat notebook berhenti, Anda tidak dapat membuka editor notebook, menghentikannya, menghapusnya, atau mengubah klaster.

Dihentikan

Notebook telah dimatikan. Anda dapat memulai notebook pada klaster yang sama, selama klaster masih berjalan. Anda dapat mengubah klaster, dan menghapus klaster.

Menghapus

Klaster sedang dihapus dari daftar klaster yang tersedia. File notebook, NotebookName.ipynb tetap di Amazon S3 dan terus menambah biaya penyimpanan yang berlaku.

Bekerja dengan editor Notebook

Keuntungan menggunakan EMR notebook adalah Anda dapat meluncurkan notebook di Jupyter atau JupyterLab langsung dari konsol.

Dengan EMR Notebook, editor notebook yang Anda akses dari EMR konsol Amazon adalah editor Notebook Jupyter sumber terbuka yang sudah dikenal atau. JupyterLab Karena editor notebook diluncurkan di dalam EMR konsol Amazon, lebih efisien untuk mengonfigurasi akses daripada dengan notebook yang dihosting di EMR cluster Amazon. Anda tidak perlu mengonfigurasi klien pengguna untuk memiliki akses web melaluiSSH, aturan grup keamanan, dan konfigurasi proxy. Jika pengguna memiliki izin yang cukup, mereka cukup membuka editor notebook di dalam EMR konsol Amazon.

Hanya satu pengguna yang dapat membuka EMR notebook pada satu waktu dari dalam AmazonEMR. Jika pengguna lain mencoba membuka EMR buku catatan yang sudah terbuka, terjadi kesalahan.

penting

Amazon EMR membuat pra-tanda tangan unik URL untuk setiap sesi editor notebook, yang hanya berlaku untuk waktu yang singkat. Kami menyarankan Anda untuk tidak membagikan editor notebookURL. Melakukan hal ini menimbulkan risiko keamanan karena penerima URL mengadopsi izin Anda untuk mengedit buku catatan dan menjalankan kode notebook selama masa pakai. URL Jika orang lain memerlukan akses ke buku catatan, berikan izin kepada pengguna mereka melalui kebijakan izin dan pastikan bahwa peran layanan untuk EMR Notebook memiliki akses ke lokasi Amazon S3. Untuk informasi selengkapnya, silakan lihat EMRkeamanan notebook dan kontrol akses dan Peran layanan untuk EMR Notebook.

Untuk membuka editor notebook untuk EMR notebook
  1. Pilih notebook dengan Status dari Siap atau Tertunda dari daftar Notebook.

  2. Pilih Buka di JupyterLab atau Buka di Jupyter.

    Tab browser baru terbuka ke editor JupyterLab atau Jupyter Notebook.

  3. Dari menu Kernel, pilih Ubah kernel lalu pilih kernel untuk bahasa pemrograman Anda.

    Anda sekarang siap untuk menulis dan menjalankan kode dari dalam editor notebook.

Menyimpan isi Notebook

Ketika Anda bekerja di editor notebook, isi sel notebook dan output disimpan secara otomatis ke file notebook secara berkala di Amazon S3. Notebook yang tidak memiliki perubahan sejak terakhir kali sel diedit menunjukkan (disimpan otomatis) di samping nama notebook di editor. Jika perubahan belum disimpan, perubahan belum disimpan muncul.

Anda bisa menyimpan notebook secara manual. Dari menu File, pilih Simpan dan Pos Pemeriksaan atau tekan CTRL +S. Ini membuat file bernama NotebookName.ipynb dalam folder pos pemeriksaan di dalam folder notebook di Amazon S3. Misalnya, s3://MyBucket/MyNotebookFolder/NotebookID/checkpoints/NotebookName.ipynb. Hanya file checkpoint terbaru yang disimpan di lokasi ini.

Mengubah klaster

Anda dapat mengubah cluster tempat EMR notebook terpasang tanpa mengubah isi notebook itu sendiri. Anda dapat mengubah klaster hanya untuk mereka notebook yang memiliki status Dihentikan.

Untuk mengubah cluster EMR notebook
  1. Jika notebook yang ingin Anda ubah sedang berjalan, pilih dari daftar Notebook dan pilih Berhenti.

  2. Ketika status notebook Dihentikan, pilih notebook dari daftar Notebook, dan kemudian pilih Tampilkan detail.

  3. Pilih Ubah klaster.

  4. Jika Anda memiliki klaster aktif yang menjalankan Hadoop, Spark, dan Livy yang Anda ingin tempelkan pada notebook, biarkan default, dan pilih klaster dari daftar. Hanya klaster yang memenuhi persyaratan terdaftar.

    — atau —

    Pilih Buat klaster lalu pilih opsi klaster. Untuk informasi selengkapnya, lihat Persyaratan klaster.

  5. Pilih satu opsi untuk Grup keamanan, lalu pilih Ubah klaster dan mulai notebook.

Menghapus Notebook dan file Notebook

Saat menghapus EMR buku catatan menggunakan EMR konsol Amazon, Anda menghapus buku catatan dari daftar buku catatan yang tersedia. Namun, file notebook, tetap di Amazon S3 dan terus menambah biaya penyimpanan yang berlaku.

Untuk menghapus notebook dan menghapus file terkait
  1. Buka EMR konsol Amazon di https://console.aws.amazon.com/elasticmapreduce/.

  2. Pilih Notebook, pilih notebook Anda dari daftar, lalu pilih Tampilkan detail.

  3. Pilih ikon folder di sebelah lokasi Notebook dan salin URL, yang ada dalam polas3://MyNotebookLocationPath/NotebookID/.

  4. Pilih Hapus.

    Notebook dihapus dari daftar, dan detail notebook tidak dapat lagi dilihat.

  5. Ikuti petunjuk untuk Bagaimana cara menghapus folder dari bucket S3? di Panduan Pengguna Layanan Penyimpanan Sederhana Amazon. Arahkan ke bucket dan folder dari langkah 3.

    —atau—

    Jika Anda telah AWS CLI menginstal, buka prompt perintah dan ketik perintah di akhir paragraf ini. Ganti lokasi Amazon S3 dengan lokasi yang Anda salin di atas. Pastikan bahwa AWS CLI dikonfigurasi dengan tombol akses pengguna dengan izin untuk menghapus lokasi Amazon S3. Untuk informasi lebih lanjut, lihat Mengonfigurasi AWS CLI di AWS Command Line Interface Panduan Pengguna.

    aws s3 rm s3://MyNotebookLocationPath/NotebookID

Berbagi file Notebook

Setiap EMR notebook disimpan ke Amazon S3 sebagai file bernama. NotebookName.ipynb Selama file notebook kompatibel dengan versi Jupyter Notebook yang sama dengan EMR Notebook, Anda dapat membuka notebook sebagai notebook. EMR

Cara termudah untuk membuka file notebook dari pengguna lain adalah dengan menyimpan file*.ipynb dari pengguna lain ke sistem file lokal Anda, lalu gunakan fitur unggah di Jupyter dan editor. JupyterLab

Anda dapat menggunakan proses ini untuk menggunakan EMR buku catatan yang dibagikan oleh orang lain, buku catatan yang dibagikan di komunitas Jupyter, atau memulihkan buku catatan yang telah dihapus dari konsol saat Anda masih memiliki file notebook.

Untuk menggunakan file notebook yang berbeda sebagai dasar untuk EMR notebook
  1. Sebelum melanjutkan, tutup editor notebook untuk notebook apa pun yang akan Anda gunakan, lalu hentikan notebook jika itu adalah EMR buku catatan.

  2. Buat EMR buku catatan dan masukkan nama untuk itu. Nama yang Anda masukkan untuk notebook akan menjadi nama file yang perlu Anda ganti. Nama file baru harus cocok dengan nama file ini persis.

  3. Buat catatan dari lokasi di Amazon S3 yang Anda pilih untuk notebook. File yang Anda ganti dalam folder dengan jejak dan nama file seperti pola berikut: s3://MyNotebookLocation/NotebookID/MyNotebookName.ipynb.

  4. Hentikan notebook.

  5. Ganti file notebook lama di lokasi Amazon S3 dengan yang baru, dengan menggunakan nama yang persis sama.

    AWS CLI Perintah berikut untuk Amazon S3 menggantikan file yang disimpan ke mesin lokal yang disebut SharedNotebook.ipynb EMR notebook dengan nama MyNotebook, IDe-12A3BCDEFJHIJKLMNO45PQRST, dan dibuat dengan MyBucket/MyNotebooksFolder ditentukan di Amazon S3. Untuk informasi tentang menggunakan konsol Amazon S3 untuk menyalin dan mengganti file, lihat Mengunggah, mengunduh, dan mengelola objek di Panduan Pengguna Layanan Penyimpanan Sederhana Amazon.

    aws s3 cp SharedNotebook.ipynb s3://MyBucket/MyNotebooksFolder/-12A3BCDEFJHIJKLMNO45PQRST/MyNotebook.ipynb