Crea un cluster con JupyterHub - Amazon EMR

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Crea un cluster con JupyterHub

Puoi creare un cluster Amazon EMR JupyterHub utilizzando AWS Management Console AWS Command Line Interface, o l'API Amazon EMR. Assicurati che il cluster non venga creato con l'opzione per terminare automaticamente dopo il completamento delle fasi (opzione --auto-terminate in AWS CLI). Inoltre, assicurati che gli amministratori e gli utenti di notebook siano in grado di accedere alla coppia di chiavi utilizzata durante la creazione del cluster. Per ulteriori informazioni, consulta la sezione relativa all'Utilizzo di una coppia di chiavi per le credenziali SSH nella Guida alla gestione di Amazon EMR.

Crea un cluster JupyterHub utilizzando la console

Utilizza la seguente procedura per creare un cluster con JupyterHub installato utilizzando Advanced Options nella console Amazon EMR.

Per creare un cluster Amazon EMR con JupyterHub installazione tramite la console Amazon EMR
  1. Passa alla nuova console Amazon EMR e seleziona Passa alla vecchia console dalla barra di navigazione laterale. Per ulteriori informazioni su cosa aspettarti quando passi alla vecchia console, consulta Utilizzo della vecchia console.

  2. Seleziona Create cluster (Crea cluster), Go to advanced options (Vai alle opzioni avanzate).

  3. In Software Configuration (Configurazione del software):

    • Per Release, seleziona emr-5.36.2 e scegli. JupyterHub

    • Se usi Spark, per utilizzare il AWS Glue Data Catalog come metastore per Spark SQL, seleziona Use for Spark table metadata. Per ulteriori informazioni, consulta Usa il AWS Glue Data Catalog come metastore per Spark SQL.

    • Per Edit software settings (Modifica impostazioni software), scegliere Enter configuration (Immetti configurazione) e specificare i valori di configurazione o scegliere Load JSON from S3 (Carica JSON da S3) e specificare un file di configurazione JSON. Per ulteriori informazioni, consulta Configurazione JupyterHub.

  4. In Add steps (optional) (Aggiungi fasi (opzionale)) configurare le fasi da eseguire quando il cluster viene creato, accertarsi che Auto-terminate cluster after the last step is completed (Una volta completata la fase, termina automaticamente il cluster) non sia selezionata e scegliere Next (Successivo).

  5. Scegliere le opzioni Hardware Configuration (Configurazione hardware), Next (Successivo). Per ulteriori informazioni, consulta la sezione relativa alla Configurazione di hardware e reti cluster nella Guida alla gestione di Amazon EMR.

  6. Scegliere opzioni per General Cluster Settings (Impostazioni generali del cluster), Next (Successivo).

  7. Scegliere Security Options (Opzioni di protezione), specificando un coppia di chiavi e scegliere Create Cluster (Crea cluster).

Crea un cluster usando il JupyterHub AWS CLI

Per avviare un cluster con JupyterHub, usa il aws emr create-cluster comando e, per l'--applicationsopzione, specificaName=JupyterHub. L'esempio seguente avvia un JupyterHub cluster su Amazon EMR con due istanze EC2 (un'istanza master e un'istanza core). Inoltre, il debug è abilitato, con i log archiviati nel percorso Amazon S3 come specificato da --log-uri. La coppia di chiavi specificata fornisce l'accesso a istanze Amazon EC2 nel cluster.

Nota

I caratteri di continuazione della riga Linux (\) sono inclusi per la leggibilità. Possono essere rimossi o utilizzati nei comandi Linux. Per Windows, rimuovili o sostituiscili con un accento circonflesso (^).

aws emr create-cluster --name="MyJupyterHubCluster" --release-label emr-5.36.2 \ --applications Name=JupyterHub --log-uri s3://MyBucket/MyJupyterClusterLogs \ --use-default-roles --instance-type m5.xlarge --instance-count 2 --ec2-attributes KeyName=MyKeyPair