Erstellen eines ETL-Auftrags mit Notebooks in AWS Glue Studio - AWS Glue

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Erstellen eines ETL-Auftrags mit Notebooks in AWS Glue Studio

Verwenden von Notebooks in der AWS Glue Studio-Konsole
  1. Hängen Sie AWS Identity and Access Management-Richtlinien an den AWS Glue Studio-Benutzer an und erstellen Sie eine IAM-Rolle für Ihren ETL-Auftrag und Ihr Notebook.

  2. Konfigurieren Sie zusätzliche IAM-Sicherheit für Notebooks, wie unter Erteilen von Berechtigungen für die IAM-Rolle beschrieben.

  3. Öffnen Sie die AWS Glue Studio-Konsole unter https://console.aws.amazon.com/gluestudio/.

    Anmerkung

    Vergewissern Sie sich, dass Ihr Browser Cookies von Drittanbietern nicht blockiert. Jeder Browser, der Cookies von Drittanbietern standardmäßig oder per Benutzereinstellung blockiert, verhindert das Starten von Notebooks. Weitere Informationen zum Verwalten von Cookies finden Sie unter:

  4. Wählen Sie das Symbol Jobs (Aufträge) im Navigationsmenü der linken Seite.

  5. Klicken Sie auf Jupyter Notebook und dann auch Create (Erstellen), um eine neue Notebook-Sitzung zu starten.

  6. Auf der Seite Create job in Jupyter notebook (Auftrag im Jupyter-Notebook erstellen) geben Sie den Auftragsnamen und die zu verwendende IAM-Rolle an. Wählen Sie Create job (Auftrag erstellen) aus.

    Nach kurzer Zeit erscheint der Notebook-Editor.

  7. Nachdem Sie den Code hinzugefügt haben, müssen Sie die Zelle ausführen, um eine Sitzung zu initiieren. Es gibt mehrere Möglichkeiten, die Zelle auszuführen:

    • Drücken Sie die Wiedergabetaste.

    • Verwenden Sie die Tastenkombination:

      • Auf MacOS, Command (Befehl) + Enter (Eingabe) um die Zelle zu auszuführen.

      • Auf Windows Shift (Umschalttaste) + Enter (Eingabe) um die Zelle auszuführen.

    Informationen zum Schreiben von Code über eine Jupyter-Notebook-Schnittstelle finden Sie unter The Jupyter Notebook User Documentation (Die Jupyter Notebook-Benutzerdokumentation).

  8. Um Ihr Skript zu testen, führen Sie das gesamte Skript oder einzelne Zellen aus. Jede Befehlsausgabe wird im Bereich unter der Zelle angezeigt.

  9. Nachdem Sie mit der Entwicklung Ihres Notebooks fertig sind, können Sie den Auftrag speichern und dann ausführen. Sie finden das Skript auf der Registerkarte Script (Skript). Alle Magics, die Sie dem Notizbuch hinzugefügt haben, werden entfernt und nicht als Teil des Skripts des generierten AWS Glue-Auftrags gespeichert.AWS Glue Studio fügt automatisch ein job.commit() am Ende Ihres generierten Skripts aus dem Notebook-Inhalt hinzu.

    Weitere Informationen zum Ausführen eines Auftrags finden Sie unter Starten einer Auftragsausführung.