Visualizzazione di interfacce Web ospitate su cluster Amazon EMR - Amazon EMR

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Visualizzazione di interfacce Web ospitate su cluster Amazon EMR

Importante

È possibile configurare un gruppo di sicurezza personalizzato per consentire l'accesso in entrata a queste interfacce Web. Tenere presente che qualsiasi porta su cui si consente il traffico in entrata rappresenta una potenziale vulnerabilità per la sicurezza. Esaminare attentamente i gruppi di sicurezza personalizzati per assicurarsi di ridurre al minimo le vulnerabilità. Per ulteriori informazioni, consulta Controllo del traffico di rete con gruppi di sicurezza.

Hadoop e altre applicazioni installate nel cluster EMR pubblicano le interfacce utente come siti Web ospitati sul nodo primario. Per motivi di sicurezza, quando si utilizzano Amazon EMR Managed Security Groups, questi siti Web sono disponibili solo sul server Web locale del nodo principale. Per questo motivo, è necessario connettersi al nodo principale per visualizzare le interfacce Web. Per ulteriori informazioni, consulta Connessione al nodo primario tramite SSH. Hadoop pubblica anche le interfacce utente come siti Web ospitati sui nodi di task e principali. Questi siti web sono disponibili anche solo sui server web locali dei nodi.

La tabella seguente elenca le interfacce Web che puoi visualizzare sulle istanze di cluster. Queste interfacce di Hadoop sono disponibili su tutti i cluster. Per le interfacce dell'istanza principale, sostituiremaster-public-dns-namecon ilDNS pubblico principaleelencato nel clusterRiepilogotocca nella console Amazon EMR. Per le interfacce di istanze principali e di task, sostituiscicoretask-public-dns-namecon ilNome DNS pubblicoelencato per l'esempio. Per trovare un'istanzaNome DNS pubblico, nella console Amazon EMR, scegli il tuo cluster dall'elenco, scegliHardwarescheda, scegliIDdel gruppo di istanze che contiene l'istanza a cui desideri connetterti, quindi prendi nota delNome DNS pubblicoelencato per l'esempio.

Nome dell'interfaccia

URI

Flink History Server (EMR versione 5.33 e successive) http://master-public-dns-name:8082/
Ganglia http://master-public-dns-name/ganglia/
Hadoop HDFSNameNode(versione EMR precedente alla 6.x) https://master-public-dns-name:50470/
Hadoop HDFSNameNode http://master-public-dns-name: 50070/
Hadoop HDFSDataNode http://coretask-public-dns-name: 50075/
Hadoop HDFSNameNode(EMR versione 6.x) https://master-public-dns-name:9870/
Hadoop HDFSDataNode(versione EMR precedente alla 6.x) https://coretask-public-dns-name:50475/
Hadoop HDFSDataNode(EMR versione 6.x) https://coretask-public-dns-name:9865/
HBase http://master-public-dns-name:16010/
Hue http://master-public-dns-name:8888/
JupyterHub https://master-public-dns-name:9443/
Livy http://master-public-dns-name:8998/
scintillaHistoryServer http://master-public-dns-name:18080/
Tez http://master-public-dns-name:8080/tez-ui
FILONodeManager http://coretask-public-dns-name:8042/
FILOResourceManager http://master-public-dns-name:808/8
Zeppelin http://master-public-dns-name:8890/

Poiché sul nodo primario sono disponibili diverse interfacce specifiche per l'applicazione che non sono disponibili sui nodi core e attività, le istruzioni di questo documento sono specifiche per il nodo primario Amazon EMR. È possibile accedere alle interfacce Web sui nodi core e attività nello stesso modo in cui si accede alle interfacce Web sul nodo primario.

Esistono diversi modi per accedere alle interfacce Web sul nodo primario. Il metodo più semplice e veloce è utilizzare SSH per connettersi al nodo primario e usare il browser basato su testo, Lynx, per visualizzare i siti Web nel proprio client SSH. Tuttavia, Lynx è un browser basato su testo con un'interfaccia utente limitata che non è in grado di visualizzare la grafica. L'esempio seguente mostra come aprire HadoopResourceManagerinterfaccia tramite Lynx (gli URL Lynx vengono forniti anche quando si accede al nodo primario tramite SSH).

lynx http://ip-###-##-##-###.us-west-2.compute.internal:8088/

Esistono altre due opzioni per accedere alle interfacce Web sul nodo primario che forniscono caratteristiche complete per il browser. Scegli una delle seguenti opzioni:

  • Opzione 1 (raccomandata per gli utenti più esperti): utilizzare un client SSH per connettersi al nodo primario, configurare il tunneling SSH con l'inoltro porta locale e utilizzare un browser Internet per aprire le interfacce Web ospitate sul nodo primario. Questo metodo consente di configurare l'accesso all'interfaccia web senza utilizzare un proxy SOCKS.

  • Opzione 2 (consigliata per i nuovi utenti): utilizza un client SSH per connetterti al nodo primario, configura il tunneling SSH con il port forwarding dinamico e configura il tuo browser Internet per utilizzare un componente aggiuntivo comeFoxyProxyper Firefox oSwitchyOmegaper Chrome per gestire le impostazioni proxy SOCKS. Questo metodo consente di filtrare automaticamente gli URL in base a modelli di testo e di limitare le impostazioni proxy a domini che corrispondono alla forma del nome DNS del nodo primario. Per ulteriori informazioni su come configurareFoxyProxyper Firefox e Google Chrome, vediOpzione 2, parte 2: configurazione delle impostazioni del proxy per visualizzare i siti Web ospitati nel nodo primario.

Nota

Se modifichi la porta in cui un'applicazione viene eseguita tramite la configurazione del cluster, il collegamento ipertestuale alla porta non verrà aggiornato nella console di Amazon EMR. Questo avviene perché la console non dispone di una caratteristica per leggere la configurazione server.port.

Con Amazon EMR versione 5.25.0 o successiva, puoi accedere all'interfaccia utente del server della cronologia Spark dalla console senza configurare un proxy Web tramite una connessione SSH. Per ulteriori informazioni, consulta Accesso con un clic a Spark History Server persistente.