Schritt 4: Richten Sie Berechtigungen für eine Delta Lake-Tabelle ein - AWS Lake Formation

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Schritt 4: Richten Sie Berechtigungen für eine Delta Lake-Tabelle ein

In diesem Abschnitt erfahren Sie, wie Sie eine Delta Lake-Tabelle mit einer Symlink-Manifestdatei in der erstellen AWS Glue Data Catalog, Datenberechtigungen in Amazon Athena einrichten AWS Lake Formation und Daten mit Amazon Athena abfragen.

So erstellen Sie eine Delta Lake-Tabelle

In diesem Schritt führen Sie einen AWS Glue Job aus, der eine Delta Lake-Transaktionstabelle im Datenkatalog erstellt.

  1. Melden Sie sich in der Region USA Ost (Nord-Virginia) unter https://console.aws.amazon.com/glue/ bei der AWS Glue Konsole an

    als Data Lake-Administratorbenutzer.

  2. Wählen Sie im linken Navigationsbereich Jobs aus.

  3. Wählen Sie native-delta-create.

  4. Wählen Sie unter Aktionen die Option Job bearbeiten aus.

  5. Erweitern Sie unter Jobdetails die Option Erweiterte Eigenschaften und aktivieren Sie das Kästchen neben Als Hive-Metastore verwenden AWS Glue Data Catalog , um die Tabellenmetadaten in der hinzuzufügen. AWS Glue Data Catalog Dies wird AWS Glue Data Catalog als Metastore für die im Job verwendeten Datenkatalogressourcen angegeben und ermöglicht, dass Lake Formation Formation-Berechtigungen später auf die Katalogressourcen angewendet werden.

  6. Wählen Sie Speichern.

  7. Wählen Sie unter Aktionen die Option Ausführen aus.

    Dieser Job erstellt eine Delta Lake-Tabelle mit dem Namen product in der lfdeltadb Datenbank. Überprüfen Sie die product Tabelle in der Lake Formation Formation-Konsole.

Um den Datenstandort bei Lake Formation zu registrieren

Als Nächstes registrieren Sie den Amazon S3 S3-Pfad als Stammverzeichnis Ihres Data Lakes.

  1. Öffnen Sie die Lake Formation Formation-Konsole unter https://console.aws.amazon.com/lakeformation/ für den Data Lake-Administratorbenutzer.

  2. Wählen Sie im Navigationsbereich unter Registrieren und aufnehmen die Option Datenstandort aus.

  3. Wählen Sie oben rechts in der Konsole die Option Speicherort registrieren aus.

  4. Geben Sie auf der Seite Speicherort registrieren Folgendes ein:

    • Amazon S3 S3-Pfad — Wählen Sie Durchsuchen und wählen Sie auslf-otf-datalake-123456789012. Klicken Sie auf den Rechtspfeil (>) neben dem Amazon S3 S3-Stammverzeichnis, um zum s3/buckets/lf-otf-datalake-123456789012/transactionaldata/native-delta Speicherort zu navigieren.

    • IAM-Rolle — Wählen Sie LF-OTF-RegisterRole als IAM-Rolle aus.

    • Wählen Sie Standort registrieren.

Um Data Lake-Berechtigungen für die Delta Lake-Tabelle zu erteilen

In diesem Schritt erteilen wir dem Business Analyst-Benutzer Data-Lake-Berechtigungen.

  1. Wählen Sie unter Data Lake-Berechtigungen die Option Grant aus.

  2. Wählen Sie auf dem Bildschirm Datenberechtigungen gewähren die Option IAM-Benutzer und -Rollen aus.

  3. lf-consumer-analystuseraus dem Drop-down-Menü.

  4. Wählen Sie Benannte Datenkatalogressource aus.

  5. Wählen Sie für Datenbankenlfdeltadb.

  6. Wählen Sie für Tabellen die Optionproduct.

  7. Als Nächstes können Sie spaltenbasierten Zugriff gewähren, indem Sie Spalten angeben.

    1. Wählen Sie unter Tabellenberechtigungen die Option Auswählen aus.

    2. Wählen Sie unter Datenberechtigungen die Option Spaltenbasierter Zugriff und dann Spalten einbeziehen aus.

    3. Wählen Sie product_nameprice, und category Spalten aus.

    4. Wählen Sie Gewähren.

Um die Delta Lake-Tabelle mit Athena abzufragen

Beginnen Sie nun mit der Abfrage der Delta Lake-Tabelle, die Sie mit Athena erstellt haben. Wenn Sie zum ersten Mal Abfragen in Athena ausführen, müssen Sie einen Speicherort für Abfrageergebnisse konfigurieren. Weitere Informationen finden Sie unter Angeben eines Speicherorts für Abfrageergebnisse.

  1. Melden Sie sich als Data Lake-Administratorbenutzer ab und melden Sie sich mit dem zuvor BusinessAnalystUser in der AWS CloudFormation Ausgabe angegebenen Kennwort in der Region USA Ost (Nord-Virginia) an.

  2. Öffnen Sie die Athena-Konsole unter https://console.aws.amazon.com/athena/.

  3. Wählen Sie Einstellungen und anschließend Verwalten aus.

  4. Geben Sie im Feld Speicherort des Abfrageergebnisses den Pfad zu dem Bucket ein, den Sie in AWS CloudFormation Ausgaben erstellt haben. Kopieren Sie den Wert von AthenaQueryResultLocation (s3://lf-otf-tutorial-123456789012/athena-results/) und speichern Sie.

  5. Führen Sie die folgende Abfrage aus, um eine Vorschau von 10 in der Delta Lake-Tabelle gespeicherten Datensätzen anzuzeigen:

    select * from lfdeltadb.product limit 10;

    Weitere Informationen zur Abfrage von Delta Lake-Tabellen finden Sie im Abschnitt Abfragen von Delta Lake-Tabellen im Amazon Athena Athena-Benutzerhandbuch.