Konfigurieren von JupyterHub - Amazon EMR

Konfigurieren von JupyterHub

Sie können die Konfiguration von JupyterHub in Amazon EMR und einzelnen Benutzer-Notebooks anpassen, indem Sie eine Verbindung mit dem Cluster-Hauptknoten herstellen und Konfigurationsdateien bearbeiten. Nachdem Sie Werte geändert haben, starten Sie den jupyterhub-Container.

Ändern Sie Eigenschaften in die folgenden Dateien zum Konfigurieren von JupyterHub und einzelnen Jupyter-Notebooks:

  • jupyterhub_config.py – Diese Datei befindet sich standardmäßig im /etc/jupyter/conf/-Verzeichnis auf dem Hauptknoten. Weitere Informationen finden Sie unter Konfigurations-Grundlagen in der JupyterHub-Dokumentation.

  • jupyter_notebook_config.py – Diese Datei wird im /etc/jupyter/-Verzeichnis gespeichert und standardmäßig in den jupyterhub-Container kopiert. Weitere Informationen finden Sie unter Konfigurationsdatei und Befehlszeilen-Optionen in der Jupyter-Notebook-Dokumentation.

Sie können auch die Konfigurationsklassifizierung jupyter-sparkmagic-conf verwenden, um Sparkmagic anzupassen. Dadurch werden Werte in der config.json-Datei für Sparkmagic aktualisiert. Weitere Informationen zu den verfügbaren Einstellungen finden Sie in der example_config.json auf GitHub. Weitere Informationen zur Verwendung von Konfigurationsklassifizierungen für Anwendungen in Amazon EMR finden Sie unter Anwendungen konfigurieren.

Das folgende Beispiel startet einen Cluster mithilfe der AWS CLI, die auf die Datei MyJupyterConfig.json für Sparkmagic-Konfigurationsklassifizierungseinstellungen verweist.

Anmerkung

Linux-Zeilenfortsetzungszeichen (\) sind aus Gründen der Lesbarkeit enthalten. Sie können entfernt oder in Linux-Befehlen verwendet werden. Entfernen Sie sie unter Windows oder ersetzen Sie sie durch ein Caret-Zeichen (^).

aws emr create-cluster --use-default-roles --release-label emr-5.14.0 \ --applications Name=Jupyter --instance-type m4.xlarge --instance-count 3 \ --ec2-attributes KeyName=MyKey,SubnetId=subnet-1234a5b6 --configurations file://MyJupyterConfig.json

Beispiele für den Inhalt der Datei MyJupyterConfig.json:

[ { "Classification":"jupyter-sparkmagic-conf", "Properties": { "kernel_python_credentials" : "{\"username\":\"diego\",\"base64_password\":\"mypass\",\"url\":\"http:\/\/localhost:8998\",\"auth\":\"None\"}" } } ]
Anmerkung

Ab Amazon-EMR-Version 5.21.0 können Sie Cluster-Konfigurationen überschreiben und zusätzliche Konfigurationsklassifikationen für jede Instance-Gruppe in einem ausgeführten Cluster angeben. Dies erfolgt über die Amazon-EMR-Konsole, die AWS Command Line Interface (AWS CLI) oder das AWS SDK. Weitere Informationen finden Sie unter Angeben einer Konfiguration für eine Instance-Gruppe in einem aktiven Cluster.