Lavorare con i EMR notebook - Amazon EMR

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Lavorare con i EMR notebook

Nota

EMRI notebook sono disponibili come EMR spazi di lavoro Studio nella console. Il pulsante Crea area di lavoro nella console consente di creare nuovi notebook. Per accedere o creare aree di lavoro, gli utenti di EMR Notebooks necessitano di autorizzazioni di ruolo aggiuntive. IAM Per ulteriori informazioni, consulta Amazon EMR Notebooks are Amazon EMR Studio Workspace nella console e nella console Amazon. EMR

Dopo aver creato un EMR notebook, l'avvio del notebook richiede poco tempo. Lo Stato nell'elenco Notebook mostra Avvio in corso. È possibile aprire un notebook quando il suo stato è Pronto. Potrebbe essere necessario più tempo a un notebook per raggiungere lo stato Pronto se hai creato un cluster insieme a esso.

Suggerimento

Aggiorna il browser oppure scegli l'icona di aggiornamento sopra l'elenco dei notebook per aggiornare lo stato.

Comprensione dello stato dei notebook

Un EMR taccuino può avere quanto segue per Status nell'elenco dei taccuini.

Stato Significato

Pronto

Puoi aprire il notebook utilizzando l'editor di notebook. Quando un notebook è in stato Pronto, è possibile arrestarlo o eliminarlo. Per modificare i cluster, devi prima arrestare il notebook. Un notebook in stato Pronto che rimane inattivo a lungo viene arrestato in automatico.

Avvio in corso

Il notebook viene creato e collegato al cluster. Mentre un notebook è in fase di avvio, non è possibile aprire l'editor di notebook, arrestarlo, eliminarlo o modificare i cluster.

In attesa

Il notebook è stato creato ed è in attesa dell'integrazione con il cluster per il completamento. È possibile che il cluster stia ancora eseguendo il provisioning delle risorse o rispondendo ad altre richieste. Puoi aprire l'editor di notebook con il notebook in modalità locale. Il codice che si affida a processi di cluster non viene eseguito e dà esito negativo.

In arresto

Il notebook è in fase di arresto o il cluster a cui è collegato il notebook è in fase di terminazione. Mentre un notebook è in fase di arresto, non è possibile aprire l'editor di notebook, arrestarlo, eliminarlo o modificare i cluster.

Arrestato

Il notebook è stato arrestato. È possibile avviare il notebook sullo stesso cluster, purché quest'ultimo sia ancora in esecuzione. Puoi modificare i cluster ed eliminare il cluster.

Eliminazione in corso

Il cluster è in fase di rimozione dall'elenco dei cluster disponibili. Il file del notebook, NotebookName.ipynb , resta in Amazon S3 e continua ad accumulare addebiti di archiviazione applicabili.

Utilizzo dell'editor di notebook

Un vantaggio dell'utilizzo di un EMR notebook è che è possibile avviarlo in Jupyter o direttamente dalla console. JupyterLab

Con EMR Notebooks, l'editor di notebook a cui accedi dalla EMR console Amazon è il familiare editor open source Jupyter Notebook o. JupyterLab Poiché l'editor di notebook viene avviato all'interno della EMR console Amazon, è più efficiente configurare l'accesso rispetto a un notebook ospitato su un EMR cluster Amazon. Non è necessario configurare il client di un utente per accedere al WebSSH, alle regole dei gruppi di sicurezza e alle configurazioni proxy. Se un utente dispone di autorizzazioni sufficienti, può semplicemente aprire l'editor di notebook nella EMR console Amazon.

Un EMR notebook può essere aperto da Amazon solo un utente alla voltaEMR. Se un altro utente tenta di aprire un EMR notebook già aperto, si verifica un errore.

Importante

Amazon EMR crea un codice prefirmato univoco URL per ogni sessione di Notebook Editor, valido solo per un breve periodo. Ti consigliamo di non condividere l'editor URL di notebook. Questa operazione crea un rischio per la sicurezza perché i destinatari del notebook URL adottano le autorizzazioni dell'utente per modificare il notebook ed eseguire il codice del notebook per l'intera durata del. URL Se altri hanno bisogno di accedere a un notebook, fornisci le autorizzazioni a un utente tramite policy di autorizzazione e assicurati che il ruolo di servizio per EMR Notebooks abbia accesso alla posizione Amazon S3. Per ulteriori informazioni, consulta EMRsicurezza e controllo degli accessi dei notebook e Ruolo di servizio per i notebook EMR.

Per aprire l'editor di notebook per un notebook EMR
  1. Seleziona un notebook con lo Stato su Pronto o In attesa dall'elenco Notebook.

  2. Scegli Apri in JupyterLab o Apri in Jupyter.

    Si apre una nuova scheda del browser nell'editor JupyterLab o Jupyter Notebook.

  3. Dal menu Kernel, scegli Cambia kernel, quindi seleziona il kernel per il tuo linguaggio di programmazione.

    Ora è tutto pronto per scrivere ed eseguire il codice dall'interno dell'editor di notebook.

Salvataggio dei contenuti di un notebook

Quando utilizzi l'editor di notebook, i contenuti delle celle di notebook e l'output vengono salvati in automatico nel file del notebook in Amazon S3 con cadenza periodica. Un notebook che non ha avuto modifiche dall'ultima volta che è una cella stata modificata mostra la dicitura (salvato in automatico) accanto al nome del notebook nell'editor. Se le modifiche non sono state ancora salvate, viene visualizzato modifiche non salvate.

È possibile salvare un notebook manualmente. Dal menu File, scegli Salva e Checkpoint o premi CTRL +S. Questo crea un file denominato NotebookName.ipynb in una cartella checkpoints all'interno della cartella Notebook in Amazon S3. Ad esempio s3://MyBucket/MyNotebookFolder/NotebookID/checkpoints/NotebookName.ipynb. Solo i file di checkpoint più recenti vengono salvati in questa posizione.

Modifica dei cluster

È possibile modificare il cluster a cui è collegato un EMR notebook senza modificare il contenuto del notebook stesso. È possibile modificare i cluster solo per i notebook che hanno lo stato Arrestato.

Per modificare il cluster di un EMR notebook
  1. Se il notebook che desideri modificare è in esecuzione, selezionalo dall'elenco Notebook e scegli Arresta.

  2. Quando lo stato del notebook è Arrestato, seleziona il notebook dall'elenco Notebook, quindi scegli Visualizza dettagli.

  3. Seleziona Modifica cluster.

  4. Se disponi di un cluster attivo che esegue Hadoop, Spark e Livy a cui desideri collegare il notebook, lascia l'impostazione predefinita e seleziona un cluster dall'elenco. Sono elencati solo i cluster che soddisfano i requisiti.

    oppure

    Seleziona Crea un cluster e quindi scegli le opzioni del cluster. Per ulteriori informazioni, consulta Requisiti del cluster.

  5. Scegli un'opzione per i Gruppi di sicurezza, quindi scegli Modifica il cluster e avvia il notebook.

Eliminazione dei notebook e dei relativi file

Quando elimini un EMR notebook utilizzando la EMR console Amazon, lo elimini dall'elenco dei notebook disponibili. Tuttavia, i file del notebook restano in Amazon S3 e continuano ad accumulare costi di archiviazione.

Eliminazione di un notebook e rimozione dei file associati
  1. Apri la EMR console Amazon all'indirizzo https://console.aws.amazon.com/elasticmapreduce/.

  2. Scegli Notebook, seleziona il notebook dall'elenco e quindi scegli Visualizza dettagli.

  3. Scegli l'icona della cartella accanto a Notebook location e copia il file URL, come indicato nello schemas3://MyNotebookLocationPath/NotebookID/.

  4. Scegli Elimina.

    Il notebook viene rimosso dall'elenco e i dettagli del notebook non possono più essere visualizzati.

  5. Per istruzioni, consulta Come eliminare cartelle da un bucket S3 nella Guida per l'utente di Amazon Simple Storage Service. Passa al bucket e alla cartella della fase 3.

    oppure

    Se hai il AWS CLI installato, apri un prompt dei comandi e digita il comando alla fine di questo paragrafo. Sostituisci il percorso Amazon S3 con quello copiato in precedenza. Assicuratevi che AWS CLI è configurato con le chiavi di accesso di un utente con le autorizzazioni per eliminare la posizione Amazon S3. Per ulteriori informazioni, consulta Configurazione di AWS CLI nella AWS Command Line Interface Guida per l'utente.

    aws s3 rm s3://MyNotebookLocationPath/NotebookID

Condivisione di file del notebook

Ogni EMR notebook viene salvato su Amazon S3 come file denominato. NotebookName.ipynb Se un file di notebook è compatibile con la stessa versione di Jupyter Notebook su cui è basato EMR Notebooks, puoi aprire il notebook come taccuino. EMR

Il modo più semplice per aprire il file di un taccuino di un altro utente consiste nel salvare il file*.ipynb di un altro utente nel file system locale, quindi utilizzare la funzione di caricamento in Jupyter e negli editor. JupyterLab

È possibile utilizzare questo processo per utilizzare EMR taccuini condivisi da altri, taccuini condivisi nella community di Jupyter o per ripristinare un notebook eliminato dalla console quando si dispone ancora del file del notebook.

Per utilizzare un file di taccuino diverso come base per un taccuino EMR
  1. Prima di procedere, chiudi l'editor del taccuino per tutti i taccuini con cui lavorerai, quindi interrompi il taccuino se si tratta di un taccuino. EMR

  2. Crea un EMR taccuino e inserisci un nome per esso. Il nome assegnato al notebook sarà il nome del file da sostituire. Il nuovo nome del file deve corrispondere esattamente a questo.

  3. Annota il percorso scelto per il notebook in Amazon S3. Il file sostituito si trova in una cartella con un percorso e un nome di file simile al pattern seguente: s3://MyNotebookLocation/NotebookID/MyNotebookName.ipynb.

  4. Arresta il notebook.

  5. Sostituisci il vecchio file del notebook nel percorso Amazon S3 con il nuovo file, utilizzando esattamente lo stesso nome.

    I seguenti AWS CLI il comando per Amazon S3 sostituisce un file salvato su un computer locale chiamato SharedNotebook.ipynb per un EMR notebook con il nome MyNotebook, un ID di e-12A3BCDEFJHIJKLMNO45PQRST e creato con MyBucket/MyNotebooksFolder specificato in Amazon S3. Per informazioni sull'uso della console di Amazon S3 per copiare e sostituire i file, consulta Caricamento, download e gestione di oggetti nella Guida per l'utente di Amazon Simple Storage Service.

    aws s3 cp SharedNotebook.ipynb s3://MyBucket/MyNotebooksFolder/-12A3BCDEFJHIJKLMNO45PQRST/MyNotebook.ipynb