JupyterLab panduan pengguna - Amazon SageMaker

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

JupyterLab panduan pengguna

Panduan ini menunjukkan kepada JupyterLab pengguna cara menjalankan alur kerja analitik dan pembelajaran mesin dalam SageMaker Studio. Anda bisa mendapatkan penyimpanan cepat dan menskalakan komputasi Anda ke atas atau ke bawah, tergantung pada kebutuhan Anda.

JupyterLab mendukung ruang pribadi dan bersama. Ruang pribadi dicakup untuk satu pengguna dalam domain. Ruang bersama memungkinkan pengguna lain di domain Anda berkolaborasi dengan Anda secara real time. Untuk informasi tentang ruang Studio, lihatRuang Amazon SageMaker Studio.

Untuk mulai menggunakan JupyterLab, buat spasi dan luncurkan JupyterLab aplikasi Anda. Ruang yang menjalankan JupyterLab aplikasi Anda adalah JupyterLab spasi. JupyterLab Ruang ini menggunakan satu instans Amazon EC2 untuk komputasi Anda dan satu volume Amazon EBS untuk penyimpanan Anda. Segala sesuatu di ruang Anda seperti kode, profil git, dan variabel lingkungan disimpan pada volume Amazon EBS yang sama. Volume ini memiliki 3000 IOPS dan throughput 125 megabyte per detik (MBps). Anda dapat menggunakan penyimpanan cepat untuk membuka dan menjalankan beberapa notebook Jupyter pada instance yang sama. Anda juga dapat mengganti kernel di notebook dengan sangat cepat.

Administrator Anda telah mengonfigurasi pengaturan penyimpanan Amazon EBS default untuk ruang Anda. Ukuran penyimpanan default adalah 5 GB, tetapi Anda dapat meningkatkan jumlah ruang yang Anda dapatkan. Anda dapat berbicara dengan administrator Anda untuk memberi Anda panduan.

Anda dapat mengganti jenis instans Amazon EC2 yang Anda gunakan untuk menjalankan JupyterLab, menskalakan komputasi Anda ke atas atau ke bawah tergantung pada kebutuhan Anda. Instans peluncuran cepat dimulai jauh lebih cepat daripada instance lainnya.

Administrator Anda mungkin memberi Anda konfigurasi siklus hidup yang menyesuaikan lingkungan Anda. Anda dapat menentukan konfigurasi siklus hidup saat Anda membuat ruang.

Jika administrator memberi Anda akses ke Amazon EFS, Anda dapat mengonfigurasi JupyterLab ruang untuk mengaksesnya.

Secara default, JupyterLab aplikasi menggunakan gambar SageMaker distribusi. Ini termasuk dukungan untuk banyak pembelajaran mesin, analitik, dan paket pembelajaran mendalam. Namun, jika Anda memerlukan gambar khusus, administrator Anda dapat membantu menyediakan akses ke gambar kustom.

Volume Amazon EBS bertahan secara independen dari kehidupan sebuah instans. Anda tidak akan kehilangan data Anda ketika Anda mengubah instance. Gunakan pustaka manajemen paket conda dan pip untuk membuat lingkungan kustom yang dapat direproduksi yang tetap ada bahkan saat Anda mengganti jenis instance.

Untuk mulai menggunakan JupyterLab, buat spasi atau pilih ruang yang dibuat administrator untuk Anda dan buka JupyterLab.

Gunakan prosedur berikut untuk membuat ruang dan terbuka JupyterLab.

Untuk membuat ruang dan terbuka JupyterLab
  1. Buka Studio. Untuk informasi tentang membuka Studio, lihatLuncurkan Amazon SageMaker Studio.

  2. Pilih JupyterLab.

  3. Pilih Buat JupyterLab ruang.

  4. Untuk Nama, tentukan nama spasi.

  5. (Opsional) Pilih Bagikan dengan domain saya untuk membuat ruang bersama.

  6. Pilih Buat ruang.

  7. (Opsional) Misalnya, tentukan instans Amazon EC2 yang menjalankan spasi.

  8. (Opsional) Untuk Gambar, tentukan gambar yang disediakan administrator Anda untuk menyesuaikan lingkungan Anda.

  9. (Opsional) Untuk Pengaturan Ruang, tentukan yang berikut ini:

    • Penyimpanan (GB) — Hingga 100 GB atau jumlah yang ditentukan administrator Anda.

    • Konfigurasi Siklus Hidup — Konfigurasi siklus hidup yang ditentukan administrator Anda.

    • Lampirkan sistem file EFS kustom — Amazon EFS tempat administrator Anda menyediakan akses.

  10. Pilih Jalankan ruang.

  11. Pilih Buka JupyterLab.

Konfigurasikan ruang

Setelah Anda membuat JupyterLab spasi, Anda dapat mengonfigurasinya untuk melakukan hal berikut:

  • Ubah jenis instance.

  • Ubah volume penyimpanan.

  • (Admin mengatur diperlukan) Gunakan gambar kustom.

  • (Diperlukan pengaturan admin) Gunakan konfigurasi siklus hidup.

  • (Diperlukan pengaturan admin) Lampirkan Amazon EFS khusus.

penting

Anda harus menghentikan JupyterLab ruang setiap kali Anda mengkonfigurasinya. Gunakan prosedur berikut untuk mengkonfigurasi ruang.

Untuk mengkonfigurasi spasi
  1. Di dalam Studio, navigasikan ke halaman JupyterLab aplikasi.

  2. Pilih nama spasi.

  3. (Opsional) Untuk Gambar, tentukan gambar yang disediakan administrator Anda untuk menyesuaikan lingkungan Anda.

  4. (Opsional) Untuk Pengaturan Ruang, tentukan yang berikut ini:

    • Penyimpanan (GB) — Hingga 100 GB atau jumlah yang dikonfigurasi administrator Anda untuk ruang tersebut.

    • Konfigurasi Siklus Hidup — Konfigurasi siklus hidup yang disediakan administrator Anda.

    • Lampirkan sistem file EFS kustom — Amazon EFS tempat administrator Anda menyediakan akses.

  5. Pilih Jalankan ruang.

Saat Anda membuka JupyterLab aplikasi, ruang Anda memiliki konfigurasi yang diperbarui.

Setelah Anda membuka JupyterLab, Anda dapat mengonfigurasi lingkungan Anda menggunakan terminal. Untuk membuka terminal, arahkan ke Launcher dan pilih Terminal.

Berikut ini adalah contoh berbagai cara Anda dapat mengonfigurasi lingkungan JupyterLab.

catatan

Di dalam Studio, Anda dapat menggunakan konfigurasi siklus hidup untuk menyesuaikan lingkungan, tetapi sebaiknya gunakan pengelola paket. Menggunakan konfigurasi siklus hidup adalah metode yang lebih rawan kesalahan. Lebih mudah untuk menambah atau menghapus dependensi daripada men-debug skrip konfigurasi siklus hidup. Hal ini juga dapat meningkatkan waktu JupyterLab startup.

Untuk informasi tentang konfigurasi siklus hidup, lihat. Menggunakan konfigurasi siklus hidup dengan JupyterLab

Sesuaikan lingkungan Anda menggunakan manajer paket

Gunakan pip atau conda untuk menyesuaikan lingkungan Anda. Sebaiknya gunakan pengelola paket alih-alih skrip konfigurasi siklus hidup.

Buat dan aktifkan lingkungan kustom Anda

Bagian ini memberikan contoh cara yang berbeda untuk mengonfigurasi lingkungan JupyterLab.

Lingkungan conda dasar memiliki jumlah minimum paket yang diperlukan untuk alur kerja Anda. SageMaker Gunakan template berikut untuk membuat lingkungan conda dasar:

# initialize conda for shell interaction conda init # create a new fresh environment conda create --name test-env # check if your new environment is created successfully conda info --envs # activate the new environment conda activate test-env # install packages in your new conda environment conda install pip boto3 pandas ipykernel # list all packages install in your new environment conda list # parse env name information from your new environment export CURRENT_ENV_NAME=$(conda info | grep "active environment" | cut -d : -f 2 | tr -d ' ') # register your new environment as Jupyter Kernel for execution python3 -m ipykernel install --user --name $CURRENT_ENV_NAME --display-name "user-env:($CURRENT_ENV_NAME)" # to exit your new environment conda deactivate

Gambar berikut menunjukkan lokasi lingkungan yang telah Anda buat.

Lingkungan test-env ditampilkan di sudut kanan atas layar.

Untuk mengubah lingkungan Anda, pilih dan pilih opsi dari menu tarik-turun.

Tanda centang dan teks yang sesuai menunjukkan contoh lingkungan yang telah Anda buat sebelumnya.

Pilih Pilih untuk memilih kernel untuk lingkungan.

Bersihkan lingkungan conda

Membersihkan lingkungan conda yang tidak Anda gunakan dapat membantu membebaskan ruang disk dan meningkatkan kinerja. Gunakan template berikut untuk membersihkan lingkungan conda:

# list your environments to select an environment to clean conda info --envs # or conda info -e # once you've selected your environment to purge conda remove --name test-env --all # run conda environment list to ensure the target environment is purged conda info --envs # or conda info -e

Buat lingkungan conda dengan versi Python tertentu

Membersihkan lingkungan conda yang tidak Anda gunakan dapat membantu membebaskan ruang disk dan meningkatkan kinerja. Gunakan template berikut untuk membersihkan lingkungan conda:

# create a conda environment with a specific python version conda create --name py38-test-env python=3.8.10 # activate and test your new python version conda activate py38-test-env & python3 --version # Install ipykernel to facilicate env registration conda install ipykernel # parse env name information from your new environment export CURRENT_ENV_NAME=$(conda info | grep "active environment" | cut -d : -f 2 | tr -d ' ') # register your new environment as Jupyter Kernel for execution python3 -m ipykernel install --user --name $CURRENT_ENV_NAME --display-name "user-env:($CURRENT_ENV_NAME)" # deactivate your py38 test environment conda deactivate

Buat lingkungan conda dengan satu set paket tertentu

Gunakan template berikut untuk membuat lingkungan conda dengan versi Python dan kumpulan paket tertentu:

# prefill your conda environment with a set of packages, conda create --name py38-test-env python=3.8.10 pandas matplotlib=3.7 scipy ipykernel # activate your conda environment and ensure these packages exist conda activate py38-test-env # check if these packages exist conda list | grep -E 'pandas|matplotlib|scipy' # parse env name information from your new environment export CURRENT_ENV_NAME=$(conda info | grep "active environment" | cut -d : -f 2 | tr -d ' ') # register your new environment as Jupyter Kernel for execution python3 -m ipykernel install --user --name $CURRENT_ENV_NAME --display-name "user-env:($CURRENT_ENV_NAME)" # deactivate your conda environment conda deactivate

Kloning conda dari lingkungan yang ada

Kloning lingkungan conda Anda untuk mempertahankan status kerjanya. Anda bereksperimen di lingkungan kloning tanpa harus khawatir memperkenalkan perubahan yang melanggar di lingkungan pengujian Anda.

Gunakan perintah berikut untuk mengkloning lingkungan.

# create a fresh env from a base environment conda create --name py310-base-ext --clone base # replace 'base' with another env # activate your conda environment and ensure these packages exist conda activate py310-base-ext # install ipykernel to register your env conda install ipykernel # parse env name information from your new environment export CURRENT_ENV_NAME=$(conda info | grep "active environment" | cut -d : -f 2 | tr -d ' ') # register your new environment as Jupyter Kernel for execution python3 -m ipykernel install --user --name $CURRENT_ENV_NAME --display-name "user-env:($CURRENT_ENV_NAME)" # deactivate your conda environment conda deactivate

Kloning conda dari file YAMAL referensi

Buat lingkungan conda dari file YAMAL referensi. Berikut ini adalah contoh file YAMB yang dapat Anda gunakan.

# anatomy of a reference environment.yml name: py311-new-env channels: - conda-forge dependencies: - python=3.11 - numpy - pandas - scipy - matplotlib - pip - ipykernel - pip: - git+https://github.com/huggingface/transformers

Di bawahpip, kami sarankan untuk menentukan hanya dependensi yang tidak tersedia dengan conda.

Gunakan perintah berikut untuk membuat lingkungan conda dari file YAMB.

# create your conda environment conda create -f environment.yml # activate your env conda activate py311-new-env

Bagikan lingkungan antar tipe instance

Anda dapat berbagi lingkungan conda dengan menyimpannya ke direktori Amazon EFS di luar volume Amazon EBS Anda. Pengguna lain dapat mengakses lingkungan di direktori tempat Anda menyimpannya.

penting

Ada batasan dengan berbagi lingkungan Anda. Misalnya, kami tidak merekomendasikan lingkungan yang dimaksudkan untuk berjalan pada instans GPU Amazon EC2 melalui lingkungan yang berjalan pada instance CPU.

Gunakan perintah berikut sebagai template untuk menentukan direktori target tempat Anda membuat lingkungan kustom. Anda membuat conda dalam jalur tertentu. Anda membuatnya dalam direktori Amazon EFS. Anda dapat memutar instance baru dan melakukan conda activate path dan melakukannya di Amazon EFS.

# if you know your environment path for your conda environment conda create --prefix /home/sagemaker-user/my-project/py39-test python=3.9 # activate the env with full path from prefix conda activate home/sagemaker-user/my-project/py39-test # parse env name information from your new environment export CURRENT_ENV_NAME=$(conda info | grep "active environment" | awk -F' : ' '{print $2}' | awk -F'/' '{print $NF}') # register your new environment as Jupyter Kernel for execution python3 -m ipykernel install --user --name $CURRENT_ENV_NAME --display-name "user-env-prefix:($CURRENT_ENV_NAME)" # deactivate your conda environment conda deactivate

Gunakan Amazon Q untuk Mempercepat Alur Kerja Machine Learning Anda

Amazon Q Developer adalah pendamping bertenaga AI Anda untuk pengembangan pembelajaran mesin. Dengan Amazon Q Developer, Anda dapat:

  • Menerima step-by-step panduan tentang penggunaan SageMaker fitur secara mandiri atau dalam kombinasi dengan AWS layanan lain.

  • Dapatkan kode sampel untuk memulai tugas ML Anda seperti persiapan data, pelatihan, inferensi, dan MLOP.

  • Menerima bantuan pemecahan masalah untuk men-debug dan menyelesaikan kesalahan yang ditemui saat menjalankan kode di. JupyterLab

Pengembang Amazon Q terintegrasi dengan mulus ke lingkungan Anda JupyterLab . Untuk menggunakan Amazon Q Developer, pilih Q dari navigasi sebelah kiri lingkungan Anda JupyterLab .

Jika Anda tidak melihat ikon Q, administrator Anda perlu mengaturnya untuk Anda. Untuk informasi selengkapnya tentang menyiapkan Pengembang Amazon Q, lihatSiapkan Amazon Q Developer untuk pengguna Anda.

Amazon Q secara otomatis memberikan saran untuk membantu Anda menulis kode Anda. Anda juga dapat meminta saran melalui antarmuka obrolan.

Setelah Anda mendapatkan saran, Anda dapat mengganti kode di sel atau Anda dapat menambahkannya ke sel baru.