Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.
Mit EMR Notizbüchern arbeiten
Anmerkung
EMRNotizbücher sind als EMR Studio-Arbeitsbereiche in der Konsole verfügbar. Mit der Schaltfläche „Arbeitsbereich erstellen“ in der Konsole können Sie neue Notizbücher erstellen. Um auf Workspaces zuzugreifen oder diese zu erstellen, benötigen EMR Notebook-Benutzer zusätzliche IAM Rollenberechtigungen. Weitere Informationen finden Sie unter Amazon EMR Notebooks sind Amazon EMR Studio-Workspaces in der Konsole und EMRAmazon-Konsole.
Nachdem Sie ein EMR Notizbuch erstellt haben, dauert es eine kurze Zeit, bis das Notizbuch gestartet wird. Der Status in der Liste Notebooks zeigt Starting (Wird gestartet) an. Sie können ein Notebook öffnen, wenn der Status Ready (Bereit) lautet. Es kann etwas länger dauern, bis ein Notebook den Status Ready (Bereit) anzeigt, wenn Sie einen Cluster mit diesem zusammen erstellt haben.
Tipp
Aktualisieren Sie Ihren Browser oder wählen Sie das Aktualisierungssymbol über der Liste „Notebooks“, um den Notebookstatus zu aktualisieren.
Grundlegendes zum Notebook-Status
Ein EMR Notizbuch kann in der Notizbuchliste den folgenden Status haben.
Status | Bedeutung |
---|---|
Bereit |
Sie können das Notebook mithilfe des Notebook-Editors öffnen. Wenn ein Notebook den Status Ready (Bereit) aufweist, können Sie es anhalten oder löschen. Um Cluster zu wechseln, müssen Sie das Notebook zuerst anhalten. Wenn ein Notebook mit dem Status Ready (Bereit) für einen langen Zeitraum inaktiv ist, wird es automatisch angehalten. |
Wird gestartet |
Das Notebook wird erstellt und an den Cluster angehängt. Während ein Notebook gestartet wird, können Sie den Notebook-Editor nicht öffnen, anhalten oder löschen und Cluster nicht wechseln. |
Ausstehend |
Das Notebook wurde erstellt und wartet darauf, dass die Integration mit dem Cluster abgeschlossen ist. Der Cluster stellt möglicherweise weiterhin Ressourcen bereit oder reagiert auf andere Anfragen. Sie können den Notebook-Editor mit dem Notebook im lokalen Modus öffnen. Code, der von Cluster-Prozessen abhängt, wird nicht ausgeführt und schlägt fehl. |
Wird angehalten |
Das Notebook wird heruntergefahren oder der Cluster, an den das Notebook angehängt ist, wird beendet. Während ein Notebook beendet wird, können Sie den Notebook-Editor nicht öffnen, anhalten oder löschen und Cluster nicht wechseln. |
Angehalten |
Das Notebook wurde heruntergefahren. Sie können das Notebook auf demselben Cluster starten, solange der Cluster noch ausgeführt wird. Sie können Cluster wechseln und den Cluster löschen. |
Löschen |
Der Cluster wird aus der Liste der verfügbaren Cluster entfernt. Die Notebook-Datei |
Arbeiten mit dem Notebook-Editor
Ein Vorteil der Verwendung eines EMR Notebooks besteht darin, dass Sie das Notizbuch in Jupyter oder JupyterLab direkt von der Konsole aus starten können.
Bei EMR Notebooks ist der Notebook-Editor, auf den Sie von der EMR Amazon-Konsole aus zugreifen, der vertraute Open-Source-Jupyter Notebook-Editor oder. JupyterLab Da der Notebook-Editor in der EMR Amazon-Konsole gestartet wird, ist die Konfiguration des Zugriffs effizienter als bei einem Notebook, das auf einem EMR Amazon-Cluster gehostet wird. Sie müssen den Client eines Benutzers nicht so konfigurierenSSH, dass er über Sicherheitsgruppenregeln und Proxykonfigurationen auf das Internet zugreifen kann. Wenn ein Benutzer über ausreichende Berechtigungen verfügt, kann er einfach den Notebook-Editor in der EMR Amazon-Konsole öffnen.
In Amazon kann jeweils nur ein Benutzer ein EMR Notizbuch öffnenEMR. Wenn ein anderer Benutzer versucht, ein EMR Notizbuch zu öffnen, das bereits geöffnet ist, tritt ein Fehler auf.
Wichtig
Amazon EMR erstellt URL für jede Notebook-Editor-Sitzung eine eindeutige Vorsignierung, die nur für kurze Zeit gültig ist. Wir empfehlen, den Notizbuch-Editor URL nicht mit anderen zu teilen. Dies stellt ein Sicherheitsrisiko dar, da die Empfänger Ihre Rechte zur Bearbeitung des Notizbuchs URL übernehmen und den Notizbuchcode für die gesamte Lebensdauer von ausführenURL. Wenn andere Benutzer Zugriff auf ein Notizbuch benötigen, gewähren Sie ihrem Benutzer über Berechtigungsrichtlinien Berechtigungen und stellen Sie sicher, dass die Servicerolle für EMR Notebooks Zugriff auf den Amazon S3 S3-Standort hat. Weitere Informationen erhalten Sie unter EMRSicherheit und Zugriffskontrolle für Notebooks und Servicerolle für EMR Notebooks.
Um den Notizbuch-Editor für ein EMR Notizbuch zu öffnen
-
Wählen Sie einen Notebook mit dem Status Ready (Bereit) oder Pending (Ausstehend) in der Liste Notebooks aus.
-
Wählen Sie Öffnen in JupyterLab oder Öffnen in Jupyter.
Für den JupyterLab oder den Jupyter Notebook-Editor wird ein neuer Browser-Tab geöffnet.
-
Wählen Sie im Menü Kernel die Option Change Kernel (Kernel ändern) und wählen Sie dann den Kernel für Ihre Programmiersprache aus.
Sie können jetzt Code innerhalb des Notebook-Editors schreiben und ausführen.
Speichern der Inhalte eines Notebooks
Wenn Sie im Notebook-Editor arbeiten, werden die Inhalte von Notebook-Zellen und Ausgaben automatisch regelmäßig in der Notebook-Datei in Amazon S3 gespeichert. Ein Notebook ohne Änderungen seit der letzten Bearbeitung von Zellen zeigt den Eintrag (autosaved) (automatisch gespeichert) neben dem Notebook-Namen im Editor an. Wenn Änderungen noch nicht gespeichert wurden, wird unsaved changes (nicht gespeicherte Änderungen) angezeigt.
Sie können ein Notebook manuell speichern. Wählen Sie im Menü Datei die Option Speichern und Checkpoint oder drücken Sie CTRL +S. Dadurch wird eine Datei mit dem Namen
in einem Checkpoints-Ordner innerhalb des Notizbuchordners in Amazon S3 erstellt. Beispiel, NotebookName
.ipynbs3://
. Nur die aktuelle Prüfpunktdatei wird an diesem Speicherort gespeichert.amzn-s3-demo-bucket
/MyNotebookFolder
/NotebookID
/checkpoints/NotebookName
.ipynb
Wechseln von Clustern
Sie können den Cluster ändern, an den ein EMR Notizbuch angeschlossen ist, ohne den Inhalt des Notizbuchs selbst zu ändern. Sie können Cluster nur für Notebooks mit dem Status Stopped (Angehalten) wechseln.
Um den Cluster eines EMR Notebooks zu ändern
-
Wenn das Notebook, das Sie wechseln möchten, ausgeführt wird, wählen Sie dieses in der Liste Notebooks und anschließend Stop (Anhalten) aus.
-
Wenn das Notebook den Status Stopped (Angehalten) aufweist, wählen Sie das Notebook in der Liste Notebooks und anschließend View details (Details anzeigen) aus.
-
Wählen Sie Change cluster (Cluster wechseln).
-
Wenn Sie einen aktiven Cluster haben, auf dem Hadoop, Spark und Livy ausgeführt werden und an den Sie das Notebook anfügen möchten, behalten Sie die Standardeinstellung bei und wählen Sie einen Cluster aus der Liste aus. Es werden nur Cluster aufgeführt, die diesen Anforderungen entsprechen.
–oder–
Wählen Sie Create a cluster (Cluster erstellen) und anschließend die Clusteroptionen. Weitere Informationen finden Sie unter Cluster-Voraussetzungen.
-
Wählen Sie eine Option für Security groups (Sicherheitsgruppen) und anschließend Change cluster and start notebook (Cluster wechseln und Notebook starten).
Löschen von Notebooks und Notebook-Dateien
Wenn Sie ein EMR Notizbuch mit der EMR Amazon-Konsole löschen, löschen Sie das Notizbuch aus der Liste der verfügbaren Notizbücher. Notebook-Dateien verbleiben jedoch in Amazon S3 und es fallen weiterhin Speicherkosten an.
So löschen Sie ein Notizbuch und entfernen die zugehörigen Dateien
Öffnen Sie die EMR Amazon-Konsole unter https://console.aws.amazon.com/elasticmapreduce/
. -
Wählen Sie Notebooks, wählen Sie Ihr Notebook aus der Liste und anschließend View details (Details anzeigen) aus.
-
Wählen Sie das Ordnersymbol neben dem Speicherort des Notebooks und kopieren Sie das URL, was im Muster enthalten ist
s3://
.MyNotebookLocationPath
/NotebookID
/ -
Wählen Sie Löschen.
Das Notebook wird aus der Liste entfernt und die Notebook-Details können nicht mehr angezeigt werden.
-
Befolgen Sie die Anweisungen für Wie kann ich Ordner aus einem S3-Bucket löschen? im Benutzerhandbuch für Amazon Simple Storage Service. Navigieren Sie zum Bucket und Ordner aus Schritt 3.
–oder–
Wenn Sie das AWS CLI installiert haben, öffnen Sie eine Befehlszeile und geben Sie den Befehl am Ende dieses Absatzes ein. Ersetzen Sie den Amazon-S3-Speicherort mit dem oben kopierten Speicherort. Stellen Sie sicher, dass der mit den Zugriffsschlüsseln eines Benutzers konfiguriert AWS CLI ist, der berechtigt ist, den Amazon S3 S3-Standort zu löschen. Weitere Informationen finden Sie unter Konfigurieren der AWS CLI im AWS Command Line Interface -Leitfaden.
aws s3 rm s3://
MyNotebookLocationPath
/NotebookID
Freigeben von Notebook-Dateien
Jedes EMR Notizbuch wird in Amazon S3 als eine Datei mit dem Namen gespeichert
. Solange eine Notizbuchdatei mit derselben Version von Jupyter Notebook kompatibel ist, auf der EMR Notebooks basiert, können Sie das Notizbuch als Notizbuch öffnen. EMRNotebookName
.ipynb
Der einfachste Weg, eine Notebook-Datei von einem anderen Benutzer zu öffnen, besteht darin, die IPYNB-Datei eines anderen Benutzers in Ihrem lokalen Dateisystem zu speichern und dann die Upload-Funktion in Jupyter und Editoren zu verwenden. JupyterLab
Sie können dieses Verfahren verwenden, um EMR Notizbücher zu verwenden, die von anderen geteilt wurden, Notizbücher, die in der Jupyter-Community geteilt wurden, oder um ein Notizbuch wiederherzustellen, das von der Konsole gelöscht wurde, obwohl Sie die Notizbuchdatei noch haben.
Um eine andere Notizbuchdatei als Grundlage für ein Notizbuch zu verwenden EMR
-
Bevor Sie fortfahren, schließen Sie den Notizbuch-Editor für alle Notizbücher, mit denen Sie arbeiten werden, und beenden Sie dann das Notizbuch, falls es sich um ein EMR Notizbuch handelt.
-
Erstellen Sie ein EMR Notizbuch und geben Sie einen Namen dafür ein. Der Name, den Sie für das Notebook eingeben, wird der Name der Datei sein, die Sie ersetzen müssen. Der neue Dateiname muss genau mit diesem Dateinamen übereinstimmen.
-
Notieren Sie sich den Speicherort in Amazon S3, den Sie für das Notebook wählen. Die Datei, die Sie ersetzen, befindet sich in einem Ordner mit einem Pfad und Dateinamen, die dem folgenden Muster entsprechen:
s3://
.MyNotebookLocation
/NotebookID
/MyNotebookName
.ipynb -
Halten Sie das Notebook an.
-
Ersetzen Sie die alte Notebook-Datei im Amazon-S3-Speicherort mit der neuen Datei, die denselben Namen trägt.
Der folgende AWS CLI Befehl für Amazon S3 ersetzt eine Datei, die auf einem lokalen Computer gespeichert wurde, der
SharedNotebook.ipynb
nach einem EMR Notizbuch benannt ist MyNotebook, mit dem Namen, einer ID vone-12A3BCDEFJHIJKLMNO45PQRST
und erstellt mit dem in Amazon S3amzn-s3-demo-bucket/MyNotebooksFolder
angegebenen Namen. Weitere Informationen zur Verwendung der Amazon S3 Konsole zum Kopieren und Ersetzen von Dateien finden Sie unter Objekte hochladen, herunterladen und verwalten im Benutzerhandbuch für Amazon Simple Storage Service..aws s3 cp SharedNotebook.ipynb s3://amzn-s3-demo-bucket/MyNotebooksFolder/-12A3BCDEFJHIJKLMNO45PQRST/MyNotebook.ipynb