Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.
Erstellen Sie einen Cluster mit JupyterHub
Sie können einen EMR Amazon-Cluster JupyterHub mithilfe von AWS Management Console AWS Command Line Interface, oder Amazon erstellen EMRAPI. Stellen Sie sicher, dass der Cluster nicht mit der Option zum automatischen Beenden nach Abschluss der Schritte angelegt wird (Option --auto-terminate
in der AWS CLI). Stellen Sie außerdem sicher, dass Administratoren und Notebook-Benutzer auf das Schlüsselpaar zugreifen können, das Sie beim Erstellen des Clusters verwenden. Weitere Informationen finden Sie unter Verwenden eines key pair für SSH Anmeldeinformationen im Amazon EMR Management Guide.
Erstellen Sie JupyterHub mithilfe der Konsole einen Cluster
Gehen Sie wie folgt vor, um einen Cluster mit JupyterHub installierten erweiterten Optionen in der EMR Amazon-Konsole zu erstellen.
Um einen EMR Amazon-Cluster zu erstellen, der über die EMR Amazon-Konsole JupyterHub installiert ist
Navigieren Sie zur neuen EMR Amazon-Konsole und wählen Sie in der Seitennavigation die Option Zur alten Konsole wechseln aus. Weitere Informationen darüber, was Sie erwartet, wenn Sie zur alten Konsole wechseln, finden Sie unter Verwenden der alten Konsole.
-
Wählen Sie Create Cluster (Cluster erstellen) und Go to advanced options (Zu erweiterten Optionen) aus.
Unter Software Configuration (Softwarekonfiguration):
Wählen Sie für Release emr-5.36.2 aus und wählen Sie. JupyterHub
Wenn Sie Spark verwenden, um den AWS Glue-Datenkatalog als Metastore für Spark zu verwendenSQL, wählen Sie Für Spark-Tabellenmetadaten verwenden aus. Weitere Informationen finden Sie unter Verwenden Sie den AWS Glue-Datenkatalog als Metastore für Spark SQL.
Wählen Sie unter Softwareeinstellungen bearbeiten die Option Konfiguration eingeben und Werte angeben, oder wählen Sie JSONAus S3 laden und geben Sie eine JSON Konfigurationsdatei an. Weitere Informationen finden Sie unter Konfiguration JupyterHub.
Konfigurieren Sie unter Add steps (optional) (Schritte hinzufügen (optional)) die Schritte, die ausgeführt werden sollen, wenn der Cluster erstellt wird, stellen Sie sicher, dass Auto-terminate cluster after the last step is completed (Cluster automatisch beenden, nachdem der letzte Schritt ausgeführt wurde) nicht ausgewählt ist, und klicken Sie auf Next (Weiter).
Wählen Sie die Option Hardware Configuration (Hardwarekonfiguration), Next (Weiter). Weitere Informationen finden Sie unter Konfiguration von Cluster-Hardware und Netzwerken im Amazon EMR Management Guide.
Wählen Sie Optionen für General Cluster Settings (Allgemeine Cluster-Einstellungen), Next (Weiter).
Wählen Sie Security Options (Sicherheitsoptionen), geben Sie ein Schlüsselpaar an und wählen Sie Create Cluster (Cluster erstellen).
Erstellen Sie einen Cluster JupyterHub mit AWS CLI
Um einen Cluster mit zu starten JupyterHub, verwenden Sie den aws emr create-cluster
Befehl und geben Sie für die --applications
Option Folgendes anName=JupyterHub
. Das folgende Beispiel startet einen JupyterHub Cluster auf Amazon EMR mit zwei EC2 Instances (eine Master- und eine Core-Instance). Außerdem ist das Debugging aktiviert, wobei die Protokolle am Amazon-S3-Speicherort gespeichert werden wie in --log-uri
angegeben. Das angegebene key pair ermöglicht den Zugriff auf EC2 Amazon-Instances im Cluster.
Anmerkung
Linux-Zeilenfortsetzungszeichen (\) sind aus Gründen der Lesbarkeit enthalten. Sie können entfernt oder in Linux-Befehlen verwendet werden. Entfernen Sie sie unter Windows oder ersetzen Sie sie durch ein Caret-Zeichen (^).
aws emr create-cluster --name="
MyJupyterHubCluster
" --release-label emr-5.36.2 \ --applications Name=JupyterHub --log-uris3://amzn-s3-demo-bucket/MyJupyterClusterLogs
\ --use-default-roles --instance-type m5.xlarge --instance-count2
--ec2-attributes KeyName=MyKeyPair