Collega un computer a uno EMR Studio Workspace - Amazon EMR

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Collega un computer a uno EMR Studio Workspace

Amazon EMR Studio esegue i comandi dei notebook utilizzando un kernel su un EMR cluster. Prima di poter selezionare un kernel, devi collegare Workspace a un cluster che utilizza EC2 istanze Amazon, a un Amazon EMR on EKS cluster o a un'EMRapplicazione Serverless. EMRStudio ti consente di collegare Workspace a cluster nuovi o esistenti e ti offre la flessibilità di modificare i cluster senza chiudere il Workspace.

Questa sezione tratta i seguenti argomenti per aiutarti a lavorare con e fornire cluster per Studio: EMR

Collega un EC2 cluster Amazon a uno EMR Studio Workspace

Puoi collegare un EMR cluster in esecuzione su Amazon EC2 a un Workspace quando crei il Workspace o collegare un cluster a un Workspace esistente. Se desideri creare e collegare un nuovo cluster, consulta Crea e collega un nuovo EMR cluster a uno Studio Workspace EMR.

Nota

Un'area di lavoro in uno Studio in cui è abilitata la propagazione IAM dell'identità affidabile di Identity Center può essere collegata solo a un EMR cluster con una configurazione di sicurezza che ha abilitato Identity Center.

On create
Collegati a un cluster di EMR calcolo Amazon quando crei un Workspace
  1. Nella finestra di dialogo Create a WorkSpace (Crea un WorkSpace), verifica di aver già selezionato una sottorete per la nuova istanza WorkSpace. Espandi la sezione Advanced configuration (Configurazione avanzata).

  2. Scegli Collega Workspace a un cluster. EMR

  3. Nell'elenco a discesa del EMRcluster, seleziona un EMR cluster esistente da collegare al Workspace.

Dopo aver collegato un cluster, completa il processo creando il WorkSpace. Quando apri il nuovo Workspace per la prima volta e scegli il pannello EMRCluster, dovresti vedere il cluster selezionato collegato.

On launch
Collegati a un cluster di EMR calcolo Amazon quando avvii Workspace
  1. Vai all'elenco dei WorkSpace e seleziona la riga relativa al WorkSpace che desideri avviare. Quindi, seleziona Avvia Workspace > Avvia con opzioni.

  2. Scegli un EMR cluster da collegare al tuo Workspace.

Dopo aver collegato un cluster, completa il processo creando il WorkSpace. Quando apri il nuovo Workspace per la prima volta e scegli il pannello EMRCluster, dovresti vedere il cluster selezionato allegato.

In JupyterLab
Collega un Workspace a un cluster di EMR calcolo Amazon in JupyterLab
  1. Seleziona il tuo WorkSpace, quindi seleziona Avvia Workspace > Avvio rapido.

  2. All'interno JupyterLab, apri la scheda Cluster nella barra laterale sinistra.

  3. Seleziona il menu a discesa EMRsul EC2 cluster o seleziona un Amazon EMR on EKS cluster.

  4. Seleziona Collega per collegare il cluster al tuo WorkSpace.

Dopo aver collegato un cluster, completa il processo creando il WorkSpace. Quando apri il nuovo Workspace per la prima volta e scegli il pannello EMRCluster, dovresti vedere il cluster selezionato allegato.

In the Workspace UI
Collega un Workspace a un cluster di EMR calcolo Amazon dall'interfaccia utente di Workspace
  1. Nell'area di lavoro che desideri collegare a un cluster, scegli l'icona dei EMRcluster nella barra laterale sinistra per aprire il pannello Cluster.

  2. In Tipo di cluster, espandi il menu a discesa e seleziona Cluster on. EMR EC2

  3. Scegli un cluster dall'elenco a discesa. Potrebbe essere necessario scollegare prima un cluster esistente per abilitare l'elenco a discesa di selezione del cluster.

  4. Scegli Collega. Quando il cluster è collegato, viene visualizzato un messaggio di esito positivo.

Collega un Amazon EMR on EKS cluster a uno EMR Studio Workspace

Oltre a utilizzare EMR i cluster Amazon in esecuzione su AmazonEC2, puoi collegare un Workspace a un Amazon EMR on EKS cluster per eseguire il codice dei notebook. Per ulteriori informazioni su Amazon EMR onEKS, consulta What is Amazon EMR on EKS.

Prima di poter connettere un Workspace a un Amazon EMR on EKS cluster, l'amministratore di Studio deve concederti le autorizzazioni di accesso.

Nota

Non puoi avviare un Amazon EMR on EKS cluster in uno EMR Studio che utilizza la propagazione IAM dell'identità affidabile di Identity Center.

On create
Per collegare un Amazon EMR su EKS cluster quando crei un Workspace
  1. Nella finestra di dialogo Create a Workspace (Creazione di un WorkSpace), espandere la sezione Advanced configuration (Configurazione avanzata).

  2. Scegli Collega Workspace a un Amazon EMR on EKS cluster.

  3. In Amazon EMR on EKS cluster, scegli un cluster dall'elenco a discesa.

  4. In Select an endpoint (Seleziona un endpoint), scegli un endpoint gestito da collegare all'istanza WorkSpace. Un endpoint gestito è un gateway che consente a EMR Studio di comunicare con il cluster prescelto.

  5. Scegli Crea un WorkSpace per completare il processo di creazione del WorkSpace e collegare il cluster selezionato.

Dopo aver collegato un cluster, è possibile completare il processo di creazione del WorkSpace. Quando apri il nuovo Workspace per la prima volta e scegli il pannello EMRCluster, dovresti vedere che il cluster selezionato è collegato.

In the Workspace UI
Per collegare un Amazon EMR su EKS cluster dall'interfaccia utente di Workspace
  1. Nel Workspace che desideri collegare a un cluster, scegli l'icona dei EMRcluster nella barra laterale sinistra per aprire il pannello Cluster.

  2. Espandi il menu a discesa del tipo di cluster e scegli Cluster on. EMR EKS

  3. In EMRCluster on EKS, scegli un cluster dall'elenco a discesa.

  4. In Endpoint, scegli un endpoint gestito da collegare all'istanza WorkSpace. Un endpoint gestito è un gateway che consente a EMR Studio di comunicare con il cluster scelto.

  5. Scegli Collega. Quando il cluster è collegato, viene visualizzato un messaggio di esito positivo.

Collega un'applicazione Amazon EMR Serverless a uno EMR Studio Workspace

Puoi collegare un workspace a un'applicazione EMR serverless per eseguire carichi di lavoro interattivi. Per ulteriori informazioni, consulta Utilizzo dei notebook per eseguire carichi di lavoro interattivi con Serverless tramite Studio. EMR EMR

Nota

Non è possibile collegare un'applicazione EMR Serverless a uno EMR Studio che utilizza IAM la propagazione delle identità attendibili di Identity Center.

Esempio Collega un workspace a un'EMRapplicazione serverless in JupyterLab

Prima di poter connettere un'area di lavoro a un'applicazione EMR serverless, l'amministratore dell'account deve concedere all'utente le autorizzazioni di accesso come descritto in Autorizzazioni richieste per carichi di lavoro interattivi.

  1. Passa a EMR Studio, seleziona il tuo spazio di lavoro, quindi seleziona Avvia Workspace > Avvio veloce.

  2. All'interno JupyterLab, apri la scheda Cluster nella barra laterale sinistra.

  3. Seleziona EMRServerless come opzione di elaborazione, quindi seleziona un'applicazione EMR Serverless e un ruolo di runtime.

  4. Per collegare il cluster al tuo WorkSpace, scegli Collega.

Ora, quando apri questo WorkSpace, dovresti vedere l'applicazione selezionata collegata.

Crea e collega un nuovo EMR cluster a uno Studio Workspace EMR

Gli utenti di Advanced EMR Studio possono effettuare il provisioning di nuovi EMR cluster in esecuzione su Amazon EC2 da utilizzare con un Workspace. Nel nuovo cluster sono installate per impostazione predefinita tutte le applicazioni Big Data necessarie per EMR Studio.

Per creare cluster, l'amministratore dello Studio deve prima concedere l'autorizzazione a utilizzare una policy di sessione. Per ulteriori informazioni, consulta Crea politiche di autorizzazione per EMR gli utenti di Studio.

È possibile creare un nuovo cluster nella finestra di dialogo Create a WorkSpace (Crea un WorkSpace) o nel riquadro Cluster dell'interfaccia utente di WorkSpace. In entrambi i casi, sono disponibili due opzioni di creazione del cluster:

  1. Crea un EMR cluster: crea un EMR cluster scegliendo il tipo e il numero di EC2 istanze Amazon.

  2. Use a cluster template (Utilizza un modello di cluster): provisioning rapido di un cluster selezionando un modello di cluster predefinito. Questa opzione è disponibile se si dispone dell'autorizzazione per utilizzare i modelli di cluster.

    Nota

    Se hai abilitato la propagazione affidabile delle IAM identità con Identity Center for your Studio, devi utilizzare un modello per creare un cluster.

Per creare un EMR cluster fornendo una configurazione del cluster
  1. Scegli un orario di inizio.

    A… Esegui questa operazione…
    Crea il cluster durante la creazione di un WorkSpace tramite la finestra di dialogo Create a WorkSpace (Crea un WorkSpace). Espandi la sezione Configurazione avanzata nella finestra di dialogo Crea un'area di lavoro e seleziona Crea un EMR cluster.
    Crea il cluster dal pannello EMRcluster nell'interfaccia utente di Workspace dopo aver creato un Workspace. Scegli la scheda EMRCluster nella barra laterale sinistra di un Workspace aperto, espandi la sezione Configurazione avanzata e scegli Crea cluster.
  2. Immetti un Cluster name (Nome cluster). L'assegnazione di un nome al cluster consente di trovarlo più avanti nell'elenco Studio Clusters. EMR

  3. Per la EMRversione Amazon, scegli una versione di EMR rilascio di Amazon per il cluster.

  4. Ad esempio, seleziona il tipo e il numero di EC2 istanze Amazon per il cluster. Per ulteriori informazioni sulla selezione dei tipi di istanza, consulta Configura i tipi di EC2 istanze Amazon da utilizzare con Amazon EMR. Un'istanza sarà utilizzata come nodo primario.

  5. Seleziona una sottorete in cui EMR Studio può avviare il nuovo cluster. Ogni opzione di sottorete è pre-approvata dall'amministratore di Studio, pertanto WorkSpace dovrebbe essere in grado di connettersi a un cluster in qualsiasi sottorete elencata.

  6. Scegli un S3 URI per l'archiviazione dei log.

  7. Scegli Crea EMR cluster per effettuare il provisioning del cluster. Se utilizzi la finestra di dialogo Crea un WorkSpace, scegli Crea un WorkSpace per creare il WorkSpace ed eseguire il provisioning del cluster. Dopo aver effettuato il provisioning del nuovo cluster, EMR Studio collega il cluster al Workspace.

Creazione di un cluster tramite un modello di cluster
  1. Scegli un orario di inizio.

    A… Esegui questa operazione…
    Crea il cluster durante la creazione di un WorkSpace tramite la finestra di dialogo Create a WorkSpace (Crea un WorkSpace). Espandi la sezione Advanced configuration (Configurazione avanzata) nella finestra di dialogo Create a WorkSpace (Crea un WorkSpace) e seleziona Use a cluster template (Utilizza un modello di cluster).
    Crea il cluster dal pannello del EMRcluster nell'interfaccia utente di Workspace. Scegli la scheda EMRCluster nella barra laterale sinistra di un Workspace aperto, espandi la sezione Configurazione avanzata, quindi scegli Modello di cluster.
  2. Seleziona un modello di cluster dall'elenco a discesa. Ogni modello di cluster disponibile include una breve descrizione che ti aiuta a effettuare una selezione.

  3. Il modello di cluster scelto può avere parametri aggiuntivi come la versione di EMR rilascio di Amazon o il nome del cluster. È possibile scegliere o inserire valori oppure utilizzare i valori predefiniti selezionati dall'amministratore.

  4. Seleziona una sottorete in cui EMR Studio può avviare il nuovo cluster. Ogni opzione di sottorete è pre-approvata dall'amministratore di Studio e WorkSpace dovrebbe essere in grado di connettersi a un cluster in qualsiasi sottorete.

  5. Scegli Use cluster template (Utilizza modello cluster) per eseguire il provisioning del cluster e collegarlo all'istanza WorkSpace. EMRStudio impiegherà alcuni minuti per creare il cluster. Se utilizzi la finestra di dialogo Crea un WorkSpace, scegli Crea un WorkSpace per creare il WorkSpace ed eseguire il provisioning del cluster. Dopo aver effettuato il provisioning del nuovo cluster, EMR Studio collega il cluster al tuo Workspace.

Scollega un calcolo da uno Studio Workspace EMR

Per scambiare il cluster collegato a un'istanza WorkSpace, è possibile scollegare un cluster dall'interfaccia utente dell'istanza WorkSpace.

Scollegamento di un cluster da un'istanza WorkSpace
  1. Nell'area di lavoro che desideri scollegare da un cluster, scegli l'icona dei EMRcluster nella barra laterale sinistra per aprire il pannello Cluster.

  2. In Seleziona cluster, scegli Scollega e attendi che EMR Studio scolleghi il cluster. Quando il cluster viene scollegato, visualizzerai un messaggio di esito positivo.

Per scollegare un'applicazione EMR Serverless da uno Studio Workspace EMR

Per scambiare il calcolo collegato a un'istanza WorkSpace, è possibile scollegare l'applicazione dall'interfaccia utente dell'istanza WorkSpace.

  1. Nell'area di lavoro che desideri staccare da un cluster, scegli l'icona Amazon EMR Compute nella barra laterale sinistra per aprire il pannello Compute.

  2. In Select compute, scegli Detach e attendi che Studio scolleghi l'applicazione. EMR Quando l'applicazione viene scollegata, visualizzerai un messaggio di esito positivo.