Erstellen Sie einen Cluster JupyterHub mithilfe der Konsole Erstellen Sie einen Cluster JupyterHub mit AWS CLI

Erstellen Sie einen Cluster mit JupyterHub

Sie können einen Amazon EMR-Cluster JupyterHub mithilfe der AWS Management Console AWS Command Line Interface, oder der Amazon EMR-API erstellen. Stellen Sie sicher, dass der Cluster nicht mit der Option zum automatischen Beenden nach Abschluss der Schritte angelegt wird (Option --auto-terminate in der AWS CLI). Stellen Sie außerdem sicher, dass Administratoren und Notebook-Benutzer auf das Schlüsselpaar zugreifen können, das Sie beim Erstellen des Clusters verwenden. Weitere Informationen finden Sie unter Verwenden eines Schlüsselpaars für SSH-Anmeldeinformationen im Verwaltungshandbuch für Amazon EMR.

Erstellen Sie einen Cluster JupyterHub mithilfe der Konsole

Gehen Sie wie folgt vor, um einen Cluster mit JupyterHub installierten erweiterten Optionen in der Amazon EMR-Konsole zu erstellen.

Um einen Amazon EMR-Cluster zu erstellen, der über die Amazon EMR-Konsole JupyterHub installiert ist

Navigieren Sie zur neuen Amazon-EMR-Konsole und wählen Sie in der Seitennavigation die Option Zur alten Konsole wechseln aus. Weitere Informationen darüber, was Sie erwartet, wenn Sie zur alten Konsole wechseln, finden Sie unter Verwenden der alten Konsole.
Wählen Sie Create Cluster (Cluster erstellen) und Go to advanced options (Zu erweiterten Optionen) aus.
Unter Software Configuration (Softwarekonfiguration):
- Wählen Sie für Version emr-5.36.2 aus und wählen Sie. JupyterHub
- Wenn Sie Spark verwenden, um den AWS Glue-Datenkatalog als Metastore für Spark-SQL zu verwenden, wählen Sie Für Spark-Tabellenmetadaten verwenden aus. Weitere Informationen finden Sie unter Verwenden Sie den AWS Glue Data Catalog-Katalog mit Spark auf Amazon EMR.
- Für Edit software settings (Softwareeinstellungen bearbeiten) wählen Sie die Option Enter configuration (Konfiguration auswählen) und geben Werte an, oder wählen Load JSON von S3 (JSON aus S3 laden) und geben eine JSON-Konfigurationsdatei an. Weitere Informationen finden Sie unter Konfiguration JupyterHub.
Konfigurieren Sie unter Add steps (optional) (Schritte hinzufügen (optional)) die Schritte, die ausgeführt werden sollen, wenn der Cluster erstellt wird, stellen Sie sicher, dass Auto-terminate cluster after the last step is completed (Cluster automatisch beenden, nachdem der letzte Schritt ausgeführt wurde) nicht ausgewählt ist, und klicken Sie auf Next (Weiter).
Wählen Sie die Option Hardware Configuration (Hardwarekonfiguration), Next (Weiter). Weitere Informationen finden Sie unter Konfigurieren von Cluster-Hardware und Netzwerken im Verwaltungshandbuch für Amazon EMR.
Wählen Sie Optionen für General Cluster Settings (Allgemeine Cluster-Einstellungen), Next (Weiter).
Wählen Sie Security Options (Sicherheitsoptionen), geben Sie ein Schlüsselpaar an und wählen Sie Create Cluster (Cluster erstellen).

Erstellen Sie einen Cluster JupyterHub mit AWS CLI

Um einen Cluster mit zu starten JupyterHub, verwenden Sie den aws emr create-cluster Befehl und geben Sie für die --applications Option Folgendes anName=JupyterHub. Das folgende Beispiel startet einen JupyterHub Cluster auf Amazon EMR mit zwei EC2 Instances (eine Master- und eine Core-Instance). Außerdem ist das Debugging aktiviert, wobei die Protokolle am Amazon-S3-Speicherort gespeichert werden wie in --log-uri angegeben. Das angegebene key pair ermöglicht den Zugriff auf EC2 Amazon-Instances im Cluster.

Anmerkung

Linux-Zeilenfortsetzungszeichen (\) sind aus Gründen der Lesbarkeit enthalten. Sie können entfernt oder in Linux-Befehlen verwendet werden. Entfernen Sie sie unter Windows oder ersetzen Sie sie durch ein Caret-Zeichen (^).


aws emr create-cluster --name="MyJupyterHubCluster" --release-label emr-5.36.2 \
--applications Name=JupyterHub --log-uri s3://amzn-s3-demo-bucket/MyJupyterClusterLogs \
--use-default-roles --instance-type m5.xlarge --instance-count 2 --ec2-attributes KeyName=MyKeyPair

Warnung JavaScript ist in Ihrem Browser nicht verfügbar oder deaktiviert.

Zur Nutzung der AWS-Dokumentation muss JavaScript aktiviert sein. Weitere Informationen finden auf den Hilfe-Seiten Ihres Browsers.

Dokumentkonventionen

JupyterHub

Überlegungen bei der Verwendung JupyterHub auf Amazon EMR