Schritt 8: Verwenden Sie einen Blueprint, um einen Workflow zu erstellen

Der AWS Lake Formation Workflow generiert die AWS Glue Jobs, Crawler und Trigger, die Daten erkennen und in Ihren Data Lake aufnehmen. Sie erstellen einen Workflow, der auf einem der vordefinierten Lake Formation-Blueprints basiert.

Wählen Sie in der Lake Formation Formation-Konsole im Navigationsbereich Blueprints und dann Blueprint verwenden aus.
Wählen Sie auf der Seite Blueprint verwenden unter Blueprint-Typ die Option Datenbank-Snapshot aus.
Wählen Sie unter Importquelle für Datenbankverbindung die Verbindung aus, die Sie gerade erstellt habendatalake-tutorial, oder wählen Sie eine bestehende Verbindung für Ihre Datenquelle aus.
Geben Sie im Formular <database>/<schema>/<table> unter Quelldatenpfad den Pfad ein, aus dem Daten aufgenommen werden sollen.

Sie können den Platzhalter Prozent (%) durch Schema oder Tabelle ersetzen. <schema><database>Geben Sie für Datenbanken, die Schemas unterstützen,<database>/<schema>/% ein, um alle darin enthaltenen Tabellen abzugleichen. Oracle Database und MySQL unterstützen kein Schema im Pfad. Geben Sie stattdessen <database>/% ein. Für Oracle Database <database>ist dies der System Identifier (SID).

Wenn eine Oracle-Datenbank beispielsweise die SID hatorcl, geben Sie ein, dass sie allen Tabellen orcl/% entspricht, auf die der in der JDCB-Verbindung angegebene Benutzer Zugriff hat.

Wichtig
Bitte beachten Sie die Groß- und Kleinschreibung.

Geben Sie unter Importziel die folgenden Parameter an:

Zieldatenbank	`lakeformation_tutorial`
Zielspeicherort	`s3://<yourName>-datalake-tutorial`
Data format (Datenformat)	(Wählen Sie Parquet oder CSV)

Wählen Sie für die Importhäufigkeit die Option Bei Bedarf ausführen aus.

Geben Sie unter Importoptionen die folgenden Parameter an:

Name des Workflows	`lakeformationjdbctest`
IAM role (IAM-Rolle)	`LakeFormationWorkflowRole`
Tabellenpräfix	`jdbctest` Anmerkung Muss in Kleinbuchstaben geschrieben werden.

Wählen Sie Create und warten Sie, bis die Konsole meldet, dass der Workflow erfolgreich erstellt wurde.

Tipp
Haben Sie die folgende Fehlermeldung erhalten?
User: arn:aws:iam::<account-id>:user/<datalake_administrator_user> is not authorized to perform: iam:PassRole on resource:arn:aws:iam::<account-id>:role/LakeFormationWorkflowRole...
Falls ja, überprüfen Sie, ob Sie <account-id>die Inline-Richtlinie für den Data Lake-Administratorbenutzer durch eine gültige AWS Kontonummer ersetzt haben.

Warnung JavaScript ist in Ihrem Browser nicht verfügbar oder deaktiviert.

Zur Nutzung der AWS-Dokumentation muss JavaScript aktiviert sein. Weitere Informationen finden auf den Hilfe-Seiten Ihres Browsers.

Dokumentkonventionen

Schritt 7: Erteilen Sie Datenberechtigungen

Schritt 9: Führen Sie den Workflow aus

Schritt 8: Verwenden Sie einen Blueprint, um einen Workflow zu erstellen

Wichtig

Anmerkung

Tipp