Opzione 2, parte 1: impostazione di un tunnel SSH sul nodo primario utilizzando l'inoltro porta dinamico - Amazon EMR

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Opzione 2, parte 1: impostazione di un tunnel SSH sul nodo primario utilizzando l'inoltro porta dinamico

Per connetterti al server Web locale sul nodo primario, crea un tunnel SSH tra il computer e il nodo primario. È noto anche come inoltro porta. Se crei il tunnel SSH utilizzando l'inoltro porte dinamico, tutto il traffico instradato verso una specifica porta locale inutilizzata viene inoltrato al server Web locale sul nodo primario. In questo modo viene creato un proxy SOCKS. È quindi possibile configurare il browser Internet per utilizzare un componente aggiuntivo come FoxyProxy o SwitchyOmega per gestire le impostazioni del proxy SOCKS.

L'utilizzo di un componente aggiuntivo per la gestione del proxy consente di filtrare automaticamente gli URL in base a modelli di testo e di limitare le impostazioni proxy a domini che corrispondono alla forma del nome DNS pubblico del nodo primario. Il componente aggiuntivo del browser gestisce automaticamente l'attivazione e la disattivazione del proxy quando si passa dalla visualizzazione di siti Web ospitati sul nodo primario a quella di siti Web su Internet.

Prima di iniziare, devi disporre del nome DNS pubblico del nodo primario e del file di chiave privata della coppia di chiavi. Per informazioni sull'individuazione del nome DNS pubblico primario, consulta Recupero del nome DNS pubblico del nodo primario con la vecchia console. Per ulteriori informazioni sull'accesso alla tua coppia di chiavi, consulta le coppie di chiavi Amazon EC2 nella Amazon EC2 User Guide. Per ulteriori informazioni sui siti da visualizzare nel nodo primario, consulta la sezione Visualizzazione di interfacce Web ospitate su cluster Amazon EMR.

Impostazione di un tunnel SSH sul nodo primario utilizzando l'inoltro porta dinamico su OpenSSH

Impostazione di un tunnel SSH utilizzando l'inoltro porta dinamico con OpenSSH
  1. Assicurati di aver consentito il traffico SSH in entrata. Per istruzioni, consulta Prima di connetterti: autorizza il traffico in entrata.

  2. Apri una finestra del terminale. In Mac OS X, selezionare Applications > Utilities > Terminal (Applicazioni > Utility > Terminale). In altre distribuzioni Linux, la finestra terminal si trova generalmente in Applications > Accessories > Terminal (Applicazioni > Accessori >; Terminale).

  3. Digitare il seguente comando per aprire un tunnel SSH sulla macchina locale. Sostituisci ~/mykeypair.pem con la posizione e il nome del file, sostituisci 8157 con un numero di porta locale non utilizzato e sostituisci .pem ec2-###-##-#-##-##.compute-1.amazonaws.com con il nome DNS pubblico principale del tuo cluster.

    ssh -i ~/mykeypair.pem -N -D 8157 hadoop@ec2-###-##-##-###.compute-1.amazonaws.com

    Dopo l'emissione di questo comando, il terminale rimane aperto e non risponde.

    Nota

    -D indica l'uso dell'inoltro porta dinamico, che consente di specificare una porta locale utilizzata per inoltrare i dati verso tutte le porte remote sul server Web locale del nodo primario. L'inoltro dinamico della porta crea un proxy SOCKS locale ascolto sulla porta specificato nel comando.

  4. Dopo che il tunnel è attivo, configurare un proxy SOCKS per il browser. Per ulteriori informazioni, consulta Opzione 2, parte 2: configurazione delle impostazioni del proxy per visualizzare i siti Web ospitati nel nodo primario.

  5. Una volta terminato il lavoro con le interfacce Web sul nodo primario, chiudi la finestra del terminale.

Configura un tunnel SSH utilizzando il port forwarding dinamico con AWS CLI

È possibile creare una connessione SSH con il nodo primario utilizzando Windows e Linux, Unix e Mac OS X. Se si utilizza il nodo AWS CLI su Linux, Unix o Mac OS X, è necessario impostare le autorizzazioni sul file come mostrato in. AWS CLI .pem Per configurare le autorizzazioni per i file chiave privati della coppia di chiavi Se si utilizza AWS CLI su Windows, PuTTY deve apparire nella variabile di ambiente path o è possibile che venga visualizzato un errore come OpenSSH o PuTTY non disponibile.

Per configurare un tunnel SSH utilizzando il port forwarding dinamico con AWS CLI
  1. Assicurati di aver consentito il traffico SSH in entrata. Per istruzioni, consulta Prima di connetterti: autorizza il traffico in entrata.

  2. Crea una connessione SSH con il nodo primario come illustrato nella Connessione al nodo primario tramite la AWS CLI.

  3. Per recuperare l'identificatore del cluster, digitare:

    aws emr list-clusters

    L'output elenca i cluster, tra cui gli ID del cluster. Prendere nota dell'ID del cluster per il cluster a cui ci si connette.

    "Status": { "Timeline": { "ReadyDateTime": 1408040782.374, "CreationDateTime": 1408040501.213 }, "State": "WAITING", "StateChangeReason": { "Message": "Waiting after step completed" } }, "NormalizedInstanceHours": 4, "Id": "j-2AL4XXXXXX5T9", "Name": "AWS CLI cluster"
  4. Per aprire un tunnel SSH con il nodo primario utilizzando l'inoltro alla porta dinamico, digita il seguente comando. Sostituire nell'esempio seguente j-2AL4XXXXXX5T9 con l'ID del cluster e sostituire ~/mykeypair.key con la posizione e il nome del file .pem (per Linux, Unix e Mac OS X) o del file .ppk (per Windows).

    aws emr socks --cluster-id j-2AL4XXXXXX5T9 --key-pair-file ~/mykeypair.key
    Nota

    Il comando socks configura automaticamente l'inoltro dinamico della porta sulla porta locale 8157. Al momento, questa impostazione non può essere modificata.

  5. Dopo che il tunnel è attivo, configurare un proxy SOCKS per il browser. Per ulteriori informazioni, consulta Opzione 2, parte 2: configurazione delle impostazioni del proxy per visualizzare i siti Web ospitati nel nodo primario.

  6. Quando hai finito di lavorare con le interfacce web sul nodo principale, chiudi la finestra. AWS CLI

    Per ulteriori informazioni sull'utilizzo dei comandi Amazon EMR in AWS CLI, consulta. https://docs.aws.amazon.com/cli/latest/reference/emr

Configurazione di un tunnel SSH per il nodo primario utilizzando PuTTY

Gli utenti Windows possono usare un client SSH come PuTTY per creare un tunnel SSH al nodo primario. Prima di connettersi al nodo primario Amazon EMR, è necessario scaricare e installare PuTTY e PuTTYgen. Questi strumenti possono essere scaricati dalla pagina di download di PuTTY.

PuTTY non supporta a livello nativo il formato di file per la chiave privata della coppia di chiavi (.pem) generato da Amazon EC2. Si utilizza PuTTYgen per convertire il file chiave nel formato PuTTY richiesto (.ppk). È necessario convertire la chiave privata nel formato .ppk prima di tentare una connessione al nodo primario tramite PuTTY.

Per ulteriori informazioni sulla conversione della chiave, consulta Convertire la chiave privata utilizzando PuTTYgen nella Guida per l'utente di Amazon EC2.

Impostazione di un tunnel SSH utilizzando l'inoltro porta dinamico su PuTTY
  1. Assicurati di aver consentito il traffico SSH in entrata. Per istruzioni, consulta Prima di connetterti: autorizza il traffico in entrata.

  2. Fai doppio clic su putty.exe per avviare PuTTY. È anche possibile avviare PuTTY dall'elenco dei programmi di Windows.

    Nota

    Se disponi già di una sessione SSH attiva con il nodo primario, puoi aggiungere un tunnel facendo clic con il pulsante destro del mouse sulla barra del titolo di PuTTY e scegliendo Change Settings (Modifica impostazioni).

  3. Se necessario, nell'elenco Category (Categoria) selezionare Session (Sessione).

  4. Nel campo Nome host, digita DNS. hadoop@ MasterPublic Ad esempio: hadoop@ec2-###-##-##-###.compute-1.amazonaws.com.

  5. Nell'elenco Category (Categoria), espandere Connection > SSH (Connessione > SSH), quindi scegliere Auth (Autenticazione).

  6. Per Private key file for authentication (File chiave privata per autenticazione), scegliere Browse (Sfoglia) e selezionare il file .ppk generato.

    Nota

    PuTTY non supporta a livello nativo il formato di file per la chiave privata della coppia di chiavi (.pem) generato da Amazon EC2. Si utilizza PuTTYgen per convertire il file chiave nel formato PuTTY richiesto (.ppk). È necessario convertire la chiave privata nel formato .ppk prima di tentare una connessione al nodo primario tramite PuTTY.

  7. Nell'elenco Category (Categoria), espandere Connection > SSH (Connessione > SSH), quindi scegliere Tunnels (Tunnel).

  8. Nel campo Source port (Porta sorgente), digita 8157 (un numero di porta locale inutilizzato), quindi seleziona Add (Aggiungi).

  9. Lasciare vuoto il campo Destination (Destinazione).

  10. Selezionare le opzioni Dynamic (Dinamico) e Auto (Automatico).

  11. Scegliere Open (Apri).

  12. Scegliere Yes (Sì) per ignorare l'avviso di sicurezza PuTTY.

    Importante

    Quando accedi al nodo primario, inserisci hadoop nel caso in cui venga richiesto un nome utente.

  13. Dopo che il tunnel è attivo, configurare un proxy SOCKS per il browser. Per ulteriori informazioni, consulta Opzione 2, parte 2: configurazione delle impostazioni del proxy per visualizzare i siti Web ospitati nel nodo primario.

  14. Una volta terminato il lavoro con le interfacce Web sul nodo primario, chiudi la finestra di PuTTY.