Creazione di un notebook - Amazon EMR

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Creazione di un notebook

Nota

I notebook EMR sono disponibili come EMR Studio Workspaces nella nuova console. È ancora possibile utilizzare i notebook esistenti nella vecchia console, ma non è possibile creare nuovi notebook nella vecchia console. Il pulsante Crea area di lavoro nella nuova console sostituisce questa funzionalità. Per accedere o creare spazi di lavoro, gli utenti di EMR Notebooks necessitano di autorizzazioni di ruolo IAM aggiuntive. Per ulteriori informazioni, consulta Amazon EMR Notebooks are Amazon EMR Studio Workspaces in new console (I notebook Amazon EMR sono Workspace Amazon EMR Studio nella nuova console) e What's new in the console? (Novità della console)

È possibile creare un notebook EMR utilizzando la vecchia console Amazon EMR. La creazione di notebook con AWS CLI o l'API di Amazon EMR non è supportata.

Creare un notebook EMR
  1. Apri la console di Amazon EMR all'indirizzo https://console.aws.amazon.com/elasticmapreduce/.

  2. Scegli Notebooks (Notebook), Create notebook (Crea notebook).

  3. Immetti un Notebook name (Nome notebook) e una Notebook description (Descrizione notebook) facoltativa.

  4. Se disponi di un cluster attivo a cui desideri collegare il notebook, lascia selezionata l'impostazione Choose an existing cluster (Scegli un cluster esistente) predefinita, fai clic su Choose (Scegli), seleziona un cluster dall’elenco, quindi fai clic su Choose cluster (Scegli cluster). Per informazioni sui requisiti del cluster per EMR Notebooks, consulta Considerazioni su quando utilizzare EMR Notebooks.

    —oppure—

    Scegli Crea un cluster, immetti un Nome del cluster e scegli le opzioni in base alle linee guida riportate di seguito. Il cluster viene creato nel VPC predefinito per l'account utilizzando istanze on demand.

    Impostazione Descrizione

    Cluster name (Nome del cluster)

    Nome descrittivo utilizzato per identificare il cluster.

    Release (Rilascio)

    Impossibile modificare. L'impostazione predefinita è l'ultima versione di Amazon EMR (5.36.1).

    Applicazioni

    Impossibile modificare. Elenca le applicazioni installate nel cluster.

    Istanza

    Immettere il numero di istanze e selezionare il tipo di istanza EC2. Per il nodo primario viene utilizzata un'istanza. Il resto viene usato per i nodi principali. Il tipo di istanza determina il numero di notebook che possono essere collegati contemporaneamente al cluster. Per ulteriori informazioni, consulta Limiti per gli EMR Notebooks collegati contemporaneamente.

    Ruolo EMR

    Lascia l'impostazione predefinita o scegli il collegamento per specificare un ruolo di servizio personalizzato per Amazon EMR. Per ulteriori informazioni, consulta Ruolo di servizio per Amazon EMR (ruolo EMR).

    Profilo dell'istanza EC2

    Lasciare l'impostazione predefinita o scegliere il collegamento per specificare un ruolo di servizio personalizzato per le istanze EC2. Per ulteriori informazioni, consulta Ruolo di servizio per istanze EC2 del cluster (profilo istanza EC2).

    EC2 key pair (Coppia di chiavi EC2)

    Scegliere una coppia di chiavi EC2 per potersi connettere alle istanze del cluster. Per ulteriori informazioni, consulta Connessione al nodo primario tramite SSH.

    Terminazione automatica La terminazione automatica è supportata per Amazon EMR versione 5.30.0, 6.1.0 e successive.

    Selezionare la casella di controllo per abilitare la terminazione automatica, quindi specificare il tempo di inattività dopo il quale il cluster dovrebbe spegnersi automaticamente. Per ulteriori informazioni, consulta Utilizzo di una policy di terminazione automatica.

  5. Per Security Group (Gruppo di sicurezza), scegli Use default security groups (Usa i gruppi di sicurezza predefiniti). In alternativa, scegliere Scegli gruppi di sicurezza e selezionare gruppi di sicurezza personalizzati disponibili nel VPC del cluster. Selezionarne uno per l'istanza primaria e un altro per l'istanza client del notebook. Per ulteriori informazioni, consulta Specifica dei gruppi di sicurezza EC2 per EMR Notebooks.

  6. Per AWS Service Role (Ruolo del servizio AWS), lascia l'impostazione predefinita o scegli un ruolo personalizzato dall'elenco. L'istanza client per il notebook utilizza questo ruolo. Per ulteriori informazioni, consulta Ruolo di servizio per EMR Notebooks.

  7. Per Notebook location (Percorso notebook) scegli il percorso Amazon S3 in cui è salvato il file del notebook, oppure specifica un percorso. Se il bucket e la cartella non esistono, Amazon EMR li crea.

    Amazon EMR crea una cartella con Notebook ID (ID notebook) come nome della cartella e salva il notebook in un file denominato NotebookName.ipynb. Ad esempio, se si specifica il percorso Amazon S3 s3://MyBucket/MyNotebooks per un notebook denominato MyFirstEMRManagedNotebook, il file del notebook viene salvato in s3://MyBucket/MyNotebooks/NotebookID/MyFirstEMRManagedNotebook.ipynb.

    Se si specifica un percorso crittografato in Amazon S3, è necessario impostare Ruolo di servizio per EMR Notebooks come utente chiave. Il ruolo di servizio predefinito è EMR_Notebooks_DefaultRole. Se utilizzi una chiave AWS KMS per la crittografia, consulta Utilizzo delle policy delle chiavi in AWS KMS nella Guida per gli sviluppatori di AWS Key Management Service e nell'Articolo di supporto per l'aggiunta di utenti della chiave.

  8. Facoltativamente, se è stato aggiunto un repository basato su Git ad Amazon EMR che si desidera associare a questo notebook, scegli Git repository (Repository Git), fai clic su Choose repository (Scegli repository) e seleziona un repository dall'elenco. Per ulteriori informazioni, consulta Associazione di repository basati su Git con EMR Notebooks.

  9. Facoltativamente è possibile scegliere Tags (Tag) e quindi aggiungere ulteriori tag chiave-valore al notebook.

    Importante

    Per l'accesso vengono applicati un tag predefinito con la stringa Key (Chiave) impostata su creatorUserID e il valore impostato per l'ID utente IAM. Consigliamo di non modificare o rimuovere questo tag perché può essere utilizzato per controllare gli accessi. Per ulteriori informazioni, consulta Utilizzo di tag di cluster e notebook con policy IAM per il controllo degli accessi.

  10. Scegliere Crea notebook.