Visualizza le interfacce Web ospitate su cluster Amazon EMR - Amazon EMR

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Visualizza le interfacce Web ospitate su cluster Amazon EMR

Importante

È possibile configurare un gruppo di sicurezza personalizzato per consentire l'accesso in entrata a queste interfacce Web. Tenere presente che qualsiasi porta su cui si consente il traffico in entrata rappresenta una potenziale vulnerabilità per la sicurezza. Esaminare attentamente i gruppi di sicurezza personalizzati per assicurarsi di ridurre al minimo le vulnerabilità. Per ulteriori informazioni, consulta Controllo del traffico di rete con gruppi di sicurezza.

Hadoop e altre applicazioni installate sul EMR cluster pubblicano interfacce utente come siti Web ospitati sul nodo primario. Per motivi di sicurezza, quando si utilizza Amazon EMR Managed Security Groups, questi siti Web sono disponibili solo sul server Web locale del nodo primario. Per questo motivo, devi connetterti al nodo primario per visualizzare le interfacce Web. Per ulteriori informazioni, consulta Connect al nodo primario utilizzando SSH. Hadoop pubblica anche le interfacce utente come siti Web ospitati sui nodi di task e principali. Questi siti web sono disponibili anche solo sui server web locali dei nodi.

La tabella seguente elenca le interfacce Web che puoi visualizzare sulle istanze di cluster. Queste interfacce di Hadoop sono disponibili su tutti i cluster. Per le interfacce dell'istanza principale, sostituisci master-public-dns-name con il Master public DNS elencato nella scheda Riepilogo del cluster nella EMR console Amazon. Per le interfacce core e task instance, sostituisci coretask-public-dns-name con il DNSnome pubblico elencato per l'istanza. Per trovare DNSil nome pubblico di un'istanza, nella EMR console Amazon, scegli il tuo cluster dall'elenco, scegli la scheda Hardware, scegli l'ID del gruppo di istanze che contiene l'istanza a cui desideri connetterti, quindi annota il DNSnome pubblico elencato per l'istanza.

Nome dell'interfaccia

URI

Flink history server (EMRversione 5.33 e successive) http://master-public-dns-name:8082/
Ganglia http://master-public-dns-name/gangli/
Hadoop HDFS NameNode (versione precedente alla 6.x) EMR https://master-public-dns-name:50470/
Hadoop HDFS NameNode http://master-public-dns-name: 50070/
Hadoop HDFS DataNode http://coretask-public-dns-name: 50075/
Hadoop HDFS NameNode (versione 6.x) EMR https://master-public-dns-name:9870/
Hadoop HDFS DataNode (versione precedente alla 6.x) EMR https://coretask-public-dns-name:50475/
Hadoop HDFS DataNode (versione 6.x) EMR https://coretask-public-dns-name:9865/
HBase http://master-public-dns-name: 16010/
Hue http://master-public-dns-name:8888/
JupyterHub https://master-public-dns-name:9443/
Livy http://master-public-dns-name: 8998/
Scintilla HistoryServer http://master-public-dns-name: 18080/
Tez http://master-public-dns-name:8080/tez-ui
YARN NodeManager http://coretask-public-dns-name:8042/
YARN ResourceManager http://master-public-dns-name:8088/
Zeppelin http://master-public-dns-name: 8890/

Poiché sul nodo primario sono disponibili diverse interfacce specifiche dell'applicazione che non sono disponibili sui nodi core e task, le istruzioni contenute in questo documento sono specifiche per il nodo primario Amazon. EMR È possibile accedere alle interfacce Web sui nodi core e attività nello stesso modo in cui si accede alle interfacce Web sul nodo primario.

Esistono diversi modi per accedere alle interfacce Web sul nodo primario. Il metodo più semplice e veloce è quello di connettersi SSH al nodo primario e utilizzare il browser testuale, Lynx, per visualizzare i siti Web del client. SSH Tuttavia, Lynx è un browser basato su testo con un'interfaccia utente limitata che non è in grado di visualizzare la grafica. L'esempio seguente mostra come aprire l' ResourceManager interfaccia Hadoop utilizzando Lynx (Lynx viene fornito anche quando si accede al URLs nodo primario utilizzando). SSH

lynx http://ip-###-##-##-###.us-west-2.compute.internal:8088/

Esistono altre due opzioni per accedere alle interfacce Web sul nodo primario che forniscono caratteristiche complete per il browser. Seleziona una delle seguenti opzioni:

  • Opzione 1 (consigliata per utenti più tecnici): utilizzare un SSH client per connettersi al nodo primario, configurare il SSH tunneling con il port forwarding locale e utilizzare un browser Internet per aprire le interfacce Web ospitate sul nodo primario. Questo metodo consente di configurare l'accesso all'interfaccia Web senza utilizzare un proxy. SOCKS

  • Opzione 2 (consigliata per i nuovi utenti): utilizza un SSH client per connettersi al nodo primario, configura il SSH tunneling con il port forwarding dinamico e configura il browser Internet per utilizzare un componente aggiuntivo come Firefox o Chrome FoxyProxy SwitchyOmega per gestire le impostazioni del proxy. SOCKS Questo metodo consente di filtrare automaticamente in URLs base a modelli di testo e di limitare le impostazioni del proxy ai domini che corrispondono alla forma del nome del nodo primario. DNS Per ulteriori informazioni su come configurare FoxyProxy Firefox e Google Chrome, consultaOpzione 2, parte 2: configurazione delle impostazioni del proxy per visualizzare i siti Web ospitati nel nodo primario.

Nota

Se modifichi la porta su cui viene eseguita un'applicazione tramite la configurazione del cluster, il collegamento ipertestuale alla porta non verrà aggiornato nella EMR console Amazon. Questo avviene perché la console non dispone di una caratteristica per leggere la configurazione server.port.

Con la EMR versione 5.25.0 o successiva di Amazon, puoi accedere all'interfaccia utente del server di cronologia Spark dalla console senza configurare un proxy Web tramite una connessione. SSH Per ulteriori informazioni, consulta Accesso con un clic a Spark History Server persistente.