Crea un cluster con JupyterHub - Amazon EMR

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Crea un cluster con JupyterHub

Puoi creare un EMR cluster Amazon JupyterHub utilizzando AWS Management Console AWS Command Line Interface, o Amazon EMRAPI. Assicurati che il cluster non venga creato con l'opzione per terminare automaticamente dopo il completamento delle fasi (opzione --auto-terminate in AWS CLI). Inoltre, assicurati che gli amministratori e gli utenti di notebook siano in grado di accedere alla coppia di chiavi utilizzata durante la creazione del cluster. Per ulteriori informazioni, consulta Use a key pair for SSH credenziali nella Amazon EMR Management Guide.

Crea un cluster JupyterHub utilizzando la console

Utilizza la seguente procedura per creare un cluster con JupyterHub installato utilizzando Advanced Options nella EMR console Amazon.

Per creare un EMR cluster Amazon con JupyterHub installazione tramite la EMR console Amazon
  1. Passa alla nuova EMR console Amazon e seleziona Passa alla vecchia console dalla barra di navigazione laterale. Per ulteriori informazioni su cosa aspettarti quando passi alla vecchia console, consulta Utilizzo della vecchia console.

  2. Seleziona Create cluster (Crea cluster), Go to advanced options (Vai alle opzioni avanzate).

  3. In Software Configuration (Configurazione del software):

    • Per Release, seleziona emr-5.36.2 e scegli. JupyterHub

    • Se usi Spark, per utilizzare il AWS Glue Data Catalog come metastore per SparkSQL, seleziona Usa per i metadati della tabella Spark. Per ulteriori informazioni, consulta Usa il AWS Glue Data Catalog come metastore per Spark SQL.

    • Per Modifica le impostazioni del software, scegli Inserisci configurazione e specifica i valori, oppure scegli Carica JSON da S3 e specifica un file di configurazione. JSON Per ulteriori informazioni, consulta Configurazione JupyterHub.

  4. In Add steps (optional) (Aggiungi fasi (opzionale)) configurare le fasi da eseguire quando il cluster viene creato, accertarsi che Auto-terminate cluster after the last step is completed (Una volta completata la fase, termina automaticamente il cluster) non sia selezionata e scegliere Next (Successivo).

  5. Scegliere le opzioni Hardware Configuration (Configurazione hardware), Next (Successivo). Per ulteriori informazioni, consulta Configurare l'hardware e la rete del cluster nella Amazon EMR Management Guide.

  6. Scegliere opzioni per General Cluster Settings (Impostazioni generali del cluster), Next (Successivo).

  7. Scegliere Security Options (Opzioni di protezione), specificando un coppia di chiavi e scegliere Create Cluster (Crea cluster).

Crea un cluster JupyterHub utilizzando il AWS CLI

Per avviare un cluster con JupyterHub, usa il aws emr create-cluster comando e, per l'--applicationsopzione, specificaName=JupyterHub. L'esempio seguente avvia un JupyterHub cluster su Amazon EMR con due EC2 istanze (un'istanza master e un'istanza principale). Inoltre, il debug è abilitato, con i log archiviati nel percorso Amazon S3 come specificato da --log-uri. La coppia di chiavi specificata fornisce l'accesso alle EC2 istanze Amazon nel cluster.

Nota

I caratteri di continuazione della riga Linux (\) sono inclusi per questioni di leggibilità. Possono essere rimossi o utilizzati nei comandi Linux. Per Windows, rimuovili o sostituiscili con un accento circonflesso (^).

aws emr create-cluster --name="MyJupyterHubCluster" --release-label emr-5.36.2 \ --applications Name=JupyterHub --log-uri s3://MyBucket/MyJupyterClusterLogs \ --use-default-roles --instance-type m5.xlarge --instance-count 2 --ec2-attributes KeyName=MyKeyPair