Konfiguration JupyterHub

Sie können die Konfiguration von Notebooks JupyterHub auf Amazon EMR und einzelnen Benutzern anpassen, indem Sie eine Verbindung zum Cluster-Masterknoten herstellen und die Konfigurationsdateien bearbeiten. Nachdem Sie Werte geändert haben, starten Sie den jupyterhub-Container.

Ändern Sie die Eigenschaften in den folgenden Dateien, um einzelne JupyterHub Jupyter-Notebooks zu konfigurieren:

jupyterhub_config.py – Diese Datei befindet sich standardmäßig im /etc/jupyter/conf/-Verzeichnis auf dem Hauptknoten. Weitere Informationen finden Sie in der Dokumentation unter Grundlagen der Konfiguration. JupyterHub
jupyter_notebook_config.py – Diese Datei wird im /etc/jupyter/-Verzeichnis gespeichert und standardmäßig in den jupyterhub-Container kopiert. Weitere Informationen finden Sie unter Konfigurationsdatei und Befehlszeilen-Optionen in der Jupyter-Notebook-Dokumentation.

Sie können auch die Konfigurationsklassifizierung jupyter-sparkmagic-conf verwenden, um Sparkmagic anzupassen. Dadurch werden Werte in der config.json-Datei für Sparkmagic aktualisiert. Weitere Informationen zu verfügbaren Einstellungen finden Sie unter example_config.json unter. GitHub Weitere Informationen zur Verwendung von Konfigurationsklassifizierungen für Anwendungen in Amazon EMR finden Sie unter Anwendungen konfigurieren.

Im folgenden Beispiel wird ein Cluster mit dem gestartet AWS CLI, der auf die Datei MyJupyterConfig.json für die Sparkmagic-Konfigurationsklassifizierungseinstellungen verweist.

Anmerkung

Linux-Zeilenfortsetzungszeichen (\) sind aus Gründen der Lesbarkeit enthalten. Sie können entfernt oder in Linux-Befehlen verwendet werden. Entfernen Sie sie unter Windows oder ersetzen Sie sie durch ein Caret-Zeichen (^).


aws emr create-cluster --use-default-roles --release-label emr-5.14.0 \
--applications Name=Jupyter --instance-type m4.xlarge --instance-count 3 \
--ec2-attributes KeyName=MyKey,SubnetId=subnet-1234a5b6 --configurations file://MyJupyterConfig.json

Beispiele für den Inhalt der Datei MyJupyterConfig.json:


[
    {
    "Classification":"jupyter-sparkmagic-conf",
    "Properties": {
      "kernel_python_credentials" : "{\"username\":\"diego\",\"base64_password\":\"mypass\",\"url\":\"http:\/\/localhost:8998\",\"auth\":\"None\"}"
      }
    }
]

Anmerkung

Ab Amazon-EMR-Version 5.21.0 können Sie Cluster-Konfigurationen überschreiben und zusätzliche Konfigurationsklassifikationen für jede Instance-Gruppe in einem ausgeführten Cluster angeben. Dazu verwenden Sie die Amazon EMR-Konsole, das AWS Command Line Interface (AWS CLI) oder das AWS SDK. Weitere Informationen finden Sie unter Angeben einer Konfiguration für eine Instance-Gruppe in einem aktiven Cluster.

Warnung JavaScript ist in Ihrem Browser nicht verfügbar oder deaktiviert.

Zur Nutzung der AWS-Dokumentation muss JavaScript aktiviert sein. Weitere Informationen finden auf den Hilfe-Seiten Ihres Browsers.

Dokumentkonventionen

Überlegungen bei der Verwendung JupyterHub auf Amazon EMR

Konfigurieren von Persistenz für Notebooks in Amazon S3