Configurando JupyterHub - Amazon EMR

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Configurando JupyterHub

Puede personalizar la configuración de los blocs de notas de usuario individuales EMR y JupyterHub en Amazon conectándose al nodo principal del clúster y editando los archivos de configuración. Después de cambiar los valores, reinicie el contenedor jupyterhub.

Modifique las propiedades de los siguientes archivos para configurar JupyterHub cada bloc de notas de Jupyter individual:

  • jupyterhub_config.py: de forma predeterminada, este archivo se guarda en el directorio de /etc/jupyter/conf/ del nodo maestro. Para obtener más información, consulte Conceptos básicos de configuración en la documentación. JupyterHub

  • jupyter_notebook_config.py: este archivo se guarda en el directorio /etc/jupyter/ de forma predeterminada y se copia en el contenedor jupyterhub como la opción predeterminada. Para obtener más información, consulte Config file and command line options en la documentación de Jupyter Notebook.

También puede utilizar la clasificación de configuración jupyter-sparkmagic-conf al crear un clúster para personalizar Sparkmagic, que actualiza los valores del archivo config.json para Sparkmagic. Para obtener más información sobre los ajustes disponibles, consulta example_config.json en. GitHub Para obtener más información sobre el uso de clasificaciones de configuración con aplicaciones en AmazonEMR, consulteConfiguración de aplicaciones.

En el siguiente ejemplo AWS CLI, se lanza un clúster utilizando el archivo MyJupyterConfig.json para los ajustes de clasificación de la configuración de Sparkmagic.

nota

Se incluyen caracteres de continuación de línea de Linux (\) para facilitar la lectura. Se pueden eliminar o utilizar en los comandos de Linux. En Windows, elimínelos o sustitúyalos por un signo de intercalación (^).

aws emr create-cluster --use-default-roles --release-label emr-5.14.0 \ --applications Name=Jupyter --instance-type m4.xlarge --instance-count 3 \ --ec2-attributes KeyName=MyKey,SubnetId=subnet-1234a5b6 --configurations file://MyJupyterConfig.json

El contenido de ejemplo de MyJupyterConfig.json es el siguiente:

[ { "Classification":"jupyter-sparkmagic-conf", "Properties": { "kernel_python_credentials" : "{\"username\":\"diego\",\"base64_password\":\"mypass\",\"url\":\"http:\/\/localhost:8998\",\"auth\":\"None\"}" } } ]
nota

Con Amazon 5.21.0 y EMR versiones posteriores, puedes anular las configuraciones de los clústeres y especificar clasificaciones de configuración adicionales para cada grupo de instancias de un clúster en ejecución. Para ello, utilice la EMR consola de Amazon, el AWS Command Line Interface (AWS CLI) o el AWS SDK. Para obtener más información, consulte Suministrar una configuración para un grupo de instancias en un clúster en ejecución.