JupyterLab guida per l'utente - Amazon SageMaker

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

JupyterLab guida per l'utente

Questa guida mostra JupyterLab agli utenti come eseguire flussi di lavoro di analisi e apprendimento automatico all'interno SageMaker di Studio. Puoi ottenere uno storage veloce e aumentare o diminuire l'elaborazione, a seconda delle tue esigenze.

JupyterLab supporta spazi privati e condivisi. Gli spazi privati sono riservati a un singolo utente in un dominio. Gli spazi condivisi consentono agli altri utenti del tuo dominio di collaborare con te in tempo reale. Per informazioni sugli spazi Studio, consultaSpazi Amazon SageMaker Studio.

Per iniziare a JupyterLab utilizzarli, crea uno spazio e avvia JupyterLab l'applicazione. Lo spazio su cui è in esecuzione JupyterLab l'applicazione è uno JupyterLab spazio. Lo JupyterLab spazio utilizza una singola istanza Amazon EC2 per l'elaborazione e un singolo volume Amazon EBS per lo storage. Tutti gli elementi presenti nel tuo spazio, ad esempio codice, profilo git e variabili di ambiente, sono archiviati nello stesso volume Amazon EBS. Il volume ha 3000 IOPS e un throughput di 125 megabyte al secondo (MBps). È possibile utilizzare lo storage veloce per aprire ed eseguire più notebook Jupyter sulla stessa istanza. È inoltre possibile cambiare i kernel di un notebook molto rapidamente.

L'amministratore ha configurato le impostazioni di storage Amazon EBS predefinite per il tuo spazio. La dimensione di archiviazione predefinita è di 5 GB, ma puoi aumentare la quantità di spazio disponibile. Puoi parlare con il tuo amministratore per fornirti delle linee guida.

Puoi cambiare il tipo di istanza Amazon EC2 che usi per l'esecuzione JupyterLab, scalando il calcolo verso l'alto o verso il basso a seconda delle tue esigenze. Le istanze Fast Launch si avviano molto più velocemente delle altre istanze.

L'amministratore potrebbe fornirti una configurazione del ciclo di vita che personalizza l'ambiente. È possibile specificare la configurazione del ciclo di vita al momento della creazione dello spazio.

Se il tuo amministratore ti dà accesso a un Amazon EFS, puoi configurare il tuo JupyterLab spazio per accedervi.

Per impostazione predefinita, l' JupyterLab applicazione utilizza l'immagine SageMaker di distribuzione. Ciò include il supporto per molti pacchetti di machine learning, analisi e deep learning. Tuttavia, se hai bisogno di un'immagine personalizzata, l'amministratore può aiutarti a fornire l'accesso alle immagini personalizzate.

Il volume Amazon EBS persiste indipendentemente dalla durata di un'istanza. Non perderai i tuoi dati quando cambi istanza. Usa le librerie di gestione dei pacchetti conda e pip per creare ambienti personalizzati riproducibili che persistono anche quando cambi tipo di istanza.

Per iniziare a utilizzarlo JupyterLab, crea uno spazio o scegli lo spazio che l'amministratore ha creato per te e apri. JupyterLab

Utilizza la procedura seguente per creare uno spazio e aprirlo JupyterLab.

Per creare uno spazio e aprirlo JupyterLab
  1. Apri Studio. Per informazioni sull'apertura di Studio, consultaAvvia Amazon SageMaker Studio.

  2. Scegliete JupyterLab.

  3. Scegli Crea JupyterLab spazio.

  4. Per Nome, specifica il nome dello spazio.

  5. (Facoltativo) Seleziona Condividi con il mio dominio per creare uno spazio condiviso.

  6. Scegli Crea spazio.

  7. (Facoltativo) Ad esempio, specifica l'istanza Amazon EC2 che gestisce lo spazio.

  8. (Facoltativo) Per Image, specifica un'immagine fornita dall'amministratore per personalizzare l'ambiente.

  9. (Facoltativo) Per Impostazioni dello spazio, specificate quanto segue:

    • Archiviazione (GB): fino a 100 GB o la quantità specificata dall'amministratore.

    • Configurazione del ciclo di vita: una configurazione del ciclo di vita specificata dall'amministratore.

    • Collega un file system EFS personalizzato: un Amazon EFS a cui l'amministratore fornisce l'accesso.

  10. Scegli Run space.

  11. Scegli Apri JupyterLab.

Configura lo spazio

Dopo aver creato uno JupyterLab spazio, puoi configurarlo per eseguire le seguenti operazioni:

  • Modificate il tipo di istanza.

  • Modifica il volume di archiviazione.

  • (È richiesta la configurazione dell'amministratore) Usa un'immagine personalizzata.

  • (È richiesta la configurazione dell'amministratore) Utilizza una configurazione del ciclo di vita.

  • (È richiesta la configurazione dell'amministratore) Collega un Amazon EFS personalizzato.

Importante

È necessario interrompere lo JupyterLab spazio ogni volta che lo si configura. Utilizzare la procedura seguente per configurare lo spazio.

Per configurare uno spazio
  1. All'interno di Studio, accedi alla pagina JupyterLab dell'applicazione.

  2. Scegli il nome dello spazio.

  3. (Facoltativo) Per Image, specificate un'immagine fornita dall'amministratore per personalizzare l'ambiente.

  4. (Facoltativo) Per Impostazioni dello spazio, specificate quanto segue:

    • Archiviazione (GB): fino a 100 GB o la quantità che l'amministratore ha configurato per lo spazio.

    • Configurazione del ciclo di vita: una configurazione del ciclo di vita fornita dall'amministratore.

    • Collega un file system EFS personalizzato: un Amazon EFS a cui l'amministratore fornisce l'accesso.

  5. Scegli Run space.

Quando apri l' JupyterLab applicazione, il tuo spazio ha la configurazione aggiornata.

Dopo l'apertura JupyterLab, è possibile configurare l'ambiente utilizzando il terminale. Per aprire il terminale, vai al Launcher e scegli Terminale.

Di seguito sono riportati alcuni esempi di diversi modi in cui è possibile configurare un ambiente. JupyterLab

Nota

All'interno di Studio, è possibile utilizzare le configurazioni del ciclo di vita per personalizzare l'ambiente, ma è consigliabile utilizzare invece un gestore di pacchetti. L'utilizzo delle configurazioni del ciclo di vita è un metodo più soggetto a errori. È più facile aggiungere o rimuovere dipendenze piuttosto che eseguire il debug di uno script di configurazione del ciclo di vita. Può anche aumentare il tempo di avvio. JupyterLab

Per informazioni sulle configurazioni del ciclo di vita, vedere. Utilizzo delle configurazioni del ciclo di vita con JupyterLab

Personalizza il tuo ambiente utilizzando un gestore di pacchetti

Usa pip o conda per personalizzare il tuo ambiente. Consigliamo di utilizzare gestori di pacchetti anziché script di configurazione del ciclo di vita.

Crea e attiva il tuo ambiente personalizzato

Questa sezione fornisce esempi di diversi modi in cui è possibile configurare un ambiente JupyterLab.

Un ambiente conda di base ha il numero minimo di pacchetti necessari per i flussi di lavoro. SageMaker Usa il seguente modello per creare un ambiente conda di base:

# initialize conda for shell interaction conda init # create a new fresh environment conda create --name test-env # check if your new environment is created successfully conda info --envs # activate the new environment conda activate test-env # install packages in your new conda environment conda install pip boto3 pandas ipykernel # list all packages install in your new environment conda list # parse env name information from your new environment export CURRENT_ENV_NAME=$(conda info | grep "active environment" | cut -d : -f 2 | tr -d ' ') # register your new environment as Jupyter Kernel for execution python3 -m ipykernel install --user --name $CURRENT_ENV_NAME --display-name "user-env:($CURRENT_ENV_NAME)" # to exit your new environment conda deactivate

L'immagine seguente mostra la posizione dell'ambiente che hai creato.

L'ambiente test-env viene visualizzato nell'angolo in alto a destra dello schermo.

Per modificare il tuo ambiente, sceglilo e seleziona un'opzione dal menu a discesa.

Il segno di spunta e il testo corrispondente mostrano un esempio di ambiente che hai creato in precedenza.

Scegliete Seleziona per selezionare un kernel per l'ambiente.

Pulisci un ambiente conda

La pulizia degli ambienti conda non utilizzati può aiutare a liberare spazio su disco e migliorare le prestazioni. Usa il seguente modello per ripulire un ambiente conda:

# list your environments to select an environment to clean conda info --envs # or conda info -e # once you've selected your environment to purge conda remove --name test-env --all # run conda environment list to ensure the target environment is purged conda info --envs # or conda info -e

Crea un ambiente conda con una versione Python specifica

La pulizia degli ambienti conda non utilizzati può aiutare a liberare spazio su disco e migliorare le prestazioni. Usa il seguente modello per ripulire un ambiente conda:

# create a conda environment with a specific python version conda create --name py38-test-env python=3.8.10 # activate and test your new python version conda activate py38-test-env & python3 --version # Install ipykernel to facilicate env registration conda install ipykernel # parse env name information from your new environment export CURRENT_ENV_NAME=$(conda info | grep "active environment" | cut -d : -f 2 | tr -d ' ') # register your new environment as Jupyter Kernel for execution python3 -m ipykernel install --user --name $CURRENT_ENV_NAME --display-name "user-env:($CURRENT_ENV_NAME)" # deactivate your py38 test environment conda deactivate

Crea un ambiente conda con un set specifico di pacchetti

Usa il seguente modello per creare un ambiente conda con una versione specifica di Python e un set di pacchetti:

# prefill your conda environment with a set of packages, conda create --name py38-test-env python=3.8.10 pandas matplotlib=3.7 scipy ipykernel # activate your conda environment and ensure these packages exist conda activate py38-test-env # check if these packages exist conda list | grep -E 'pandas|matplotlib|scipy' # parse env name information from your new environment export CURRENT_ENV_NAME=$(conda info | grep "active environment" | cut -d : -f 2 | tr -d ' ') # register your new environment as Jupyter Kernel for execution python3 -m ipykernel install --user --name $CURRENT_ENV_NAME --display-name "user-env:($CURRENT_ENV_NAME)" # deactivate your conda environment conda deactivate

Clona conda da un ambiente esistente

Clona il tuo ambiente conda per preservarne lo stato di funzionamento. Sperimentate nell'ambiente clonato senza dovervi preoccupare di introdurre modifiche epocali nel vostro ambiente di test.

Utilizzate il seguente comando per clonare un ambiente.

# create a fresh env from a base environment conda create --name py310-base-ext --clone base # replace 'base' with another env # activate your conda environment and ensure these packages exist conda activate py310-base-ext # install ipykernel to register your env conda install ipykernel # parse env name information from your new environment export CURRENT_ENV_NAME=$(conda info | grep "active environment" | cut -d : -f 2 | tr -d ' ') # register your new environment as Jupyter Kernel for execution python3 -m ipykernel install --user --name $CURRENT_ENV_NAME --display-name "user-env:($CURRENT_ENV_NAME)" # deactivate your conda environment conda deactivate

Clona conda da un file YAML di riferimento

Crea un ambiente conda da un file YAML di riferimento. Di seguito è riportato un esempio di file YAML che è possibile utilizzare.

# anatomy of a reference environment.yml name: py311-new-env channels: - conda-forge dependencies: - python=3.11 - numpy - pandas - scipy - matplotlib - pip - ipykernel - pip: - git+https://github.com/huggingface/transformers

In bassopip, consigliamo di specificare solo le dipendenze che non sono disponibili con conda.

Usa i seguenti comandi per creare un ambiente conda da un file YAML.

# create your conda environment conda create -f environment.yml # activate your env conda activate py311-new-env

Condividi ambienti tra tipi di istanze

Puoi condividere ambienti conda salvandoli in una directory Amazon EFS esterna al tuo volume Amazon EBS. Un altro utente può accedere all'ambiente nella directory in cui lo hai salvato.

Importante

La condivisione degli ambienti presenta delle limitazioni. Ad esempio, non consigliamo un ambiente progettato per l'esecuzione su un'istanza GPU Amazon EC2 rispetto a un ambiente in esecuzione su un'istanza CPU.

Utilizza i seguenti comandi come modello per specificare la directory di destinazione in cui stai creando un ambiente personalizzato. Stai creando un conda all'interno di un percorso particolare. Lo crei all'interno della directory Amazon EFS. Puoi avviare una nuova istanza ed eseguire il percorso di attivazione conda e farlo all'interno di Amazon EFS.

# if you know your environment path for your conda environment conda create --prefix /home/sagemaker-user/my-project/py39-test python=3.9 # activate the env with full path from prefix conda activate home/sagemaker-user/my-project/py39-test # parse env name information from your new environment export CURRENT_ENV_NAME=$(conda info | grep "active environment" | awk -F' : ' '{print $2}' | awk -F'/' '{print $NF}') # register your new environment as Jupyter Kernel for execution python3 -m ipykernel install --user --name $CURRENT_ENV_NAME --display-name "user-env-prefix:($CURRENT_ENV_NAME)" # deactivate your conda environment conda deactivate

Usa Amazon Q per accelerare i flussi di lavoro di Machine Learning

Amazon Q Developer è il tuo partner basato sull'intelligenza artificiale per lo sviluppo dell'apprendimento automatico. Con Amazon Q Developer, puoi:

  • Ricevi step-by-step indicazioni sull'utilizzo SageMaker delle funzionalità in modo indipendente o in combinazione con altri AWS servizi.

  • Ottieni codice di esempio per iniziare le tue attività di machine learning come la preparazione dei dati, la formazione, l'inferenza e gli MLOP.

  • Ricevi assistenza per la risoluzione dei problemi per eseguire il debug e risolvere gli errori riscontrati durante l'esecuzione del codice. JupyterLab

Amazon Q Developer si integra perfettamente nel tuo JupyterLab ambiente. Per utilizzare Amazon Q Developer, scegli Q dalla barra di navigazione a sinistra del tuo JupyterLab ambiente.

Se non vedi l'icona Q, il tuo amministratore deve configurarla per te. Per ulteriori informazioni sulla configurazione di Amazon Q Developer, consultaConfigura Amazon Q Developer per i tuoi utenti.

Amazon Q fornisce automaticamente suggerimenti per aiutarti a scrivere il codice. Puoi anche chiedere suggerimenti tramite l'interfaccia di chat.

Dopo aver ricevuto un suggerimento, puoi sostituire il codice nella cella o aggiungerlo a una nuova cella.