Schritt 8: Verwenden Sie einen Blueprint, um einen Workflow zu erstellen - AWS Lake Formation

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Schritt 8: Verwenden Sie einen Blueprint, um einen Workflow zu erstellen

Der AWS Lake Formation Workflow generiert die AWS Glue Jobs, Crawler und Trigger, die Daten erkennen und in Ihren Data Lake aufnehmen. Sie erstellen einen Workflow, der auf einem der vordefinierten Lake Formation-Blueprints basiert.

  1. Wählen Sie in der Lake Formation Formation-Konsole im Navigationsbereich Blueprints und dann Blueprint verwenden aus.

  2. Wählen Sie auf der Seite Blueprint verwenden unter Blueprint-Typ die Option Datenbank-Snapshot aus.

  3. Wählen Sie unter Importquelle für Datenbankverbindung die Verbindung aus, die Sie gerade erstellt habendatalake-tutorial, oder wählen Sie eine bestehende Verbindung für Ihre Datenquelle aus.

  4. Geben Sie im Formular <database>/<schema>/<table> unter Quelldatenpfad den Pfad ein, aus dem Daten aufgenommen werden sollen.

    Sie können den Platzhalter Prozent (%) durch Schema oder Tabelle ersetzen. <schema><database>Geben Sie für Datenbanken, die Schemas unterstützen,<database>/<schema>/% ein, um alle darin enthaltenen Tabellen abzugleichen. Oracle Database und MySQL unterstützen kein Schema im Pfad. Geben Sie stattdessen <database>/% ein. Für Oracle Database <database>ist dies der System Identifier (SID).

    Wenn eine Oracle-Datenbank beispielsweise die SID hatorcl, geben Sie ein, dass sie allen Tabellen orcl/% entspricht, auf die der in der JDCB-Verbindung angegebene Benutzer Zugriff hat.

    Wichtig

    Bitte beachten Sie die Groß- und Kleinschreibung.

  5. Geben Sie unter Importziel die folgenden Parameter an:

    Zieldatenbank lakeformation_tutorial
    Zielspeicherort s3://<yourName>-datalake-tutorial
    Data format (Datenformat) (Wählen Sie Parquet oder CSV)
  6. Wählen Sie für die Importhäufigkeit die Option Bei Bedarf ausführen aus.

  7. Geben Sie unter Importoptionen die folgenden Parameter an:

    Name des Workflows lakeformationjdbctest
    IAM role (IAM-Rolle) LakeFormationWorkflowRole
    Tabellenpräfix jdbctest
    Anmerkung

    Muss in Kleinbuchstaben geschrieben werden.

  8. Wählen Sie Create und warten Sie, bis die Konsole meldet, dass der Workflow erfolgreich erstellt wurde.

    Tipp

    Haben Sie die folgende Fehlermeldung erhalten?

    User: arn:aws:iam::<account-id>:user/<datalake_administrator_user> is not authorized to perform: iam:PassRole on resource:arn:aws:iam::<account-id>:role/LakeFormationWorkflowRole...

    Falls ja, überprüfen Sie, ob Sie <account-id>die Inline-Richtlinie für den Data Lake-Administratorbenutzer durch eine gültige AWS Kontonummer ersetzt haben.