Ver las interfaces web alojadas en los EMR clústeres de Amazon - Amazon EMR

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Ver las interfaces web alojadas en los EMR clústeres de Amazon

importante

Es posible configurar un grupo de seguridad personalizado para permitir el acceso entrante a estas interfaces web. Tenga en cuenta que cualquier puerto en el que permita el tráfico entrante representa una posible vulnerabilidad de seguridad. Revise con atención los grupos de seguridad personalizados para asegurarse de minimizar las vulnerabilidades. Para obtener más información, consulte Control del tráfico de red con grupos de seguridad.

Hadoop y otras aplicaciones que instale en su EMR clúster publican las interfaces de usuario como sitios web que se alojan en el nodo principal. Por motivos de seguridad, cuando se utilizan grupos de seguridad EMR gestionados por Amazon, estos sitios web solo están disponibles en el servidor web local del nodo principal. Por ese motivo, debe conectarse al nodo principal para ver las interfaces web. Para obtener más información, consulte Conéctese al nodo principal mediante SSH. Hadoop también publica las interfaces de usuario como sitios web alojados en los nodos secundarios y de tareas. Estos sitios web también se encuentran disponibles solo en servidores web locales en los nodos.

En la tabla siguiente, se muestran las interfaces web que puede ver en las instancias de clúster. Estas interfaces de Hadoop están disponibles en todos los clústeres. Para las interfaces de la instancia maestra, sustituya master-public-dns-name con el público principal DNS listado en la pestaña Resumen del clúster de la EMR consola de Amazon. Para las interfaces principales y de instancias de tareas, sustituya coretask-public-dns-name por el DNSnombre público que aparece en la lista de la instancia. Para encontrar el DNSnombre público de una instancia, en la EMR consola de Amazon, elige tu clúster de la lista, elige la pestaña Hardware, elige el ID del grupo de instancias que contiene la instancia a la que quieres conectarte y, a continuación, anota el DNSnombre público que aparece para la instancia.

Nombre de interfaz

URI

Servidor de historial de Flink (EMRversión 5.33 y posteriores) http://master-public-dns-name:8082/
Ganglia http://master-public-dns-name/ganglios/
HDFS NameNode Hadoop (versión anterior a la 6.x) EMR https://master-public-dns-name:50470/
Hadoop HDFS NameNode http://master-public-dns-name:50070/
Hadoop HDFS DataNode http://coretask-public-dns-name:50075/
Hadoop HDFS NameNode (versión 6.x) EMR https://master-public-dns-name:9870/
Hadoop HDFS DataNode (versión anterior a la 6.x) EMR https://coretask-public-dns-name:50475/
Hadoop HDFS DataNode (versión 6.x) EMR https://coretask-public-dns-name:9865/
HBase http://master-public-dns-name:16010/
Hue http://master-public-dns-name:8888/
JupyterHub https://master-public-dns-name:9443/
Livy http://master-public-dns-name:8998/
Chispa HistoryServer http://master-public-dns-name:18080/
Tez http://master-public-dns-name:8080/tez-ui
YARN NodeManager http://coretask-public-dns-name:8042/
YARN ResourceManager http://master-public-dns-name:8088/
Zeppelin http://master-public-dns-name:8890/

Como hay varias interfaces específicas de la aplicación disponibles en el nodo principal que no están disponibles en los nodos principal y de tareas, las instrucciones de este documento son específicas para el nodo EMR principal de Amazon. El acceso a las interfaces web en los nodos secundarios y de tarea puede realizarse de la misma manera en que se accedería a las interfaces web en el nodo principal.

Existen varias formas en las que puede acceder a las interfaces web en el nodo principal. El método más fácil y rápido consiste en conectarse SSH al nodo principal y utilizar el navegador basado en texto, Lynx, para ver los sitios web del cliente. SSH Sin embargo, Lynx es un navegador basado en texto con una interfaz de usuario limitada que no puede mostrar gráficos. El siguiente ejemplo muestra cómo abrir la ResourceManager interfaz de Hadoop mediante Lynx (los Lynx también URLs se proporcionan al iniciar sesión en el nodo principal mediante Lynx). SSH

lynx http://ip-###-##-##-###.us-west-2.compute.internal:8088/

Existen dos opciones restantes para acceder a las interfaces web en el nodo principal que proporcionan una funcionalidad del navegador completa. Seleccione una de las siguientes opciones:

  • Opción 1 (recomendada para usuarios más técnicos): utilizar un SSH cliente para conectarse al nodo principal, configurar la SSH tunelización con el reenvío de puertos local y utilizar un navegador de Internet para abrir las interfaces web alojadas en el nodo principal. Este método le permite configurar el acceso a la interfaz web sin utilizar un proxy. SOCKS

  • Opción 2 (recomendada para nuevos usuarios): utilice un SSH cliente para conectarse al nodo principal, configure la SSH tunelización con un reenvío dinámico de puertos y configure su navegador de Internet para que utilice un complemento, como FoxyProxy Firefox o Chrome, SwitchyOmega para administrar la configuración SOCKS del proxy. Este método te permite filtrar automáticamente en URLs función de los patrones de texto y limitar la configuración del proxy a los dominios que coincidan con la forma del nombre del nodo principal. DNS Para obtener más información sobre cómo configurar FoxyProxy Firefox y Google Chrome, consulteOpción 2, parte 2: configurar ajustes de proxy para ver sitios web alojados en el nodo principal.

nota

Si modificas el puerto en el que se ejecuta una aplicación mediante la configuración del clúster, el hipervínculo al puerto no se actualizará en la EMR consola de Amazon. Esto se debe a que la consola no tiene la funcionalidad de leer la configuración de server.port.

Con la EMR versión 5.25.0 o posterior de Amazon, puedes acceder a la interfaz de usuario del servidor de historial de Spark desde la consola sin configurar un proxy web a través de una SSH conexión. Para obtener más información, consulte Acceso de un clic al servidor del historial de Spark persistente.