Configuration de JupyterHub - Amazon EMR

Configuration de JupyterHub

Vous pouvez personnaliser la configuration de JupyterHub sur Amazon EMR et les bloc-notes pour utilisateur individuel en vous connectant au nœud principal du cluster et en modification les fichiers de configuration. Après avoir modifié les valeurs, redémarrez le conteneur jupyterhub.

Modifiez les propriétés dans les fichiers suivants pour configurer JupyterHub et les blocs-notes Jupyter individuels :

  • jupyterhub_config.py – Par défaut, ce fichier est enregistré dans le répertoire /etc/jupyter/conf/ sur le nœud principal. Pour plus d'informations, consultez Principes de base de la configuration dans la documentation JupyterHub.

  • jupyter_notebook_config.py – Ce fichier est enregistré dans le répertoire /etc/jupyter/ par défaut et copié dans le conteneur jupyterhub en tant que valeur par défaut. Pour plus d'informations, consultez Fichier de configuration et options de ligne de commande dans la documentation sur les bloc-notes Jupyter.

Vous pouvez également utiliser la classification de configuration jupyter-sparkmagic-conf pour personnaliser Sparkmagic, ce qui met à jour les valeurs du fichier config.json pour Sparkmagic. Pour plus d'informations concernant les paramètres disponibles, consultez le fichier example_config.json sur GitHub. Pour plus d'informations sur l'utilisation des classifications de configuration avec des applications dans Amazon EMR, consultez Configuration des applications.

L'exemple suivant lance un cluster à l'aide de l'AWS CLI, en référençant le fichier MyJupyterConfig.json pour les paramètres de la classification de configuration Sparkmagic.

Note

Les caractères de continuation de ligne Linux (\) sont inclus pour des raisons de lisibilité. Ils peuvent être supprimés ou utilisés dans les commandes Linux. Pour Windows, supprimez-les ou remplacez-les par un caret (^).

aws emr create-cluster --use-default-roles --release-label emr-5.14.0 \ --applications Name=Jupyter --instance-type m4.xlarge --instance-count 3 \ --ec2-attributes KeyName=MyKey,SubnetId=subnet-1234a5b6 --configurations file://MyJupyterConfig.json

Exemples de contenu du fichier MyJupyterConfig.json :

[ { "Classification":"jupyter-sparkmagic-conf", "Properties": { "kernel_python_credentials" : "{\"username\":\"diego\",\"base64_password\":\"mypass\",\"url\":\"http:\/\/localhost:8998\",\"auth\":\"None\"}" } } ]
Note

Avec la version 5.21.0 et ultérieures d'Amazon EMR, vous permet de remplacer les configurations de cluster et de spécifier des classifications de configuration supplémentaires pour chaque groupe d'instances dans un cluster en cours d'exécution. Pour ce faire, vous pouvez utiliser la console Amazon EMR, le AWS Command Line Interface (AWS CLI) ou le AWS SDK. Pour plus d'informations, consultez Fourniture d'une configuration pour un groupe d'instances dans un cluster en cours d'exécution.