Cree un clúster con JupyterHub - Amazon EMR

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Cree un clúster con JupyterHub

Puedes crear un EMR clúster de Amazon JupyterHub con AWS Management Console AWS Command Line Interface, o Amazon EMRAPI. Asegúrese de que el clúster no se crea con la opción de terminar automáticamente después de completar los pasos (opción --auto-terminate de la AWS CLI). Además, asegúrese de que los administradores y los usuarios de blocs de notas puedan obtener acceso al par de claves que utiliza al crear el clúster. Para obtener más información, consulta Cómo usar un key pair para SSH las credenciales en la Amazon EMR Management Guide.

Cree un clúster JupyterHub con la consola

Utilice el siguiente procedimiento para crear un clúster JupyterHub instalado mediante las opciones avanzadas de la EMR consola de Amazon.

Para crear un EMR clúster de Amazon JupyterHub instalado mediante la EMR consola de Amazon
  1. Ve a la nueva EMR consola de Amazon y selecciona Cambiar a la consola anterior en el panel de navegación lateral. Para más información sobre lo que puede esperar al cambiar a la consola antigua, consulte Uso de la consola antigua.

  2. Elija Crear clúster e Ir a las opciones avanzadas.

  3. En Software Configuration (Configuración de software):

    • Para Release, selecciona emr-5.36.2 y elige. JupyterHub

    • Si usas Spark, para usar el catálogo de datos de AWS Glue como metaalmacén de SparkSQL, selecciona Usar para metadatos de tablas de Spark. Para obtener más información, consulte Usa el catálogo de datos de AWS Glue como metaalmacén de Spark SQL.

    • En Editar los ajustes del software, selecciona Introducir la configuración y especificar los valores, o selecciona Cargar JSON desde S3 y especifica un archivo JSON de configuración. Para obtener más información, consulte Configurando JupyterHub.

  4. En Add steps (optional) (Añadir pasos (opcional)) configure los pasos que se ejecutarán cuando se cree el clúster, asegúrese de que no se ha seleccionado Auto-terminate cluster after the last step is completed (Terminar automáticamente el clúster después de que se complete el último paso) y elija Next (Siguiente).

  5. Elija opciones de Hardware Configuration (Configuración de hardware) y Next (Siguiente). Para obtener más información, consulte Configurar el hardware y las redes del clúster en la Amazon EMR Management Guide.

  6. Elija las opciones de General Cluster Settings (Configuración general del clúster) y Next (Siguiente).

  7. Elija Security Options (Opciones de seguridad), especifique un par de claves y, a continuación, elija Create Cluster (Crear clúster).

Cree un clúster JupyterHub mediante el AWS CLI

Para lanzar un clúster con JupyterHub, utilice el aws emr create-cluster comando y, para la --applications opción, especifiqueName=JupyterHub. En el siguiente ejemplo, se lanza un JupyterHub clúster en Amazon EMR con dos EC2 instancias (una instancia principal y una instancia principal). Además, la depuración está habilitada y los registros se almacenan en la ubicación de Amazon S3 especificada mediante --log-uri. El par de claves especificado proporciona acceso a EC2 las instancias de Amazon del clúster.

nota

Se incluyen caracteres de continuación de línea de Linux (\) para facilitar la lectura. Se pueden eliminar o utilizar en los comandos de Linux. En Windows, elimínelos o sustitúyalos por un signo de intercalación (^).

aws emr create-cluster --name="MyJupyterHubCluster" --release-label emr-5.36.2 \ --applications Name=JupyterHub --log-uri s3://MyBucket/MyJupyterClusterLogs \ --use-default-roles --instance-type m5.xlarge --instance-count 2 --ec2-attributes KeyName=MyKeyPair