Abfragen von Metadatentabellen mit AWS Analysediensten - Amazon Simple Storage Service

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Abfragen von Metadatentabellen mit AWS Analysediensten

Sie können Ihre verwalteten S3-Metadatentabellen mit AWS Analysediensten wie Amazon Athena, Amazon Redshift und Amazon EMR abfragen.

Bevor Sie Abfragen ausführen können, müssen Sie zunächst die AWS verwalteten S3-Tabellen-Buckets in Ihrer Region AWS-Konto und Ihrer Region mit Analysediensten integrieren. AWS

Abfragen von Metadatentabellen mit Amazon Athena

Nachdem Sie Ihre AWS verwalteten S3-Tabellen-Buckets mit AWS Analysediensten integriert haben, können Sie mit der Abfrage Ihrer Metadatentabellen in Athena beginnen. Gehen Sie in Ihren Abfragen wie folgt vor:

  • Geben Sie Ihren Katalog als s3tablescatalog/aws-s3 und Ihre Datenbank als an b_general_purpose_bucket_name (was normalerweise der Namespace für Ihre Metadatentabellen ist).

  • Stellen Sie sicher, dass Sie die Namespace-Namen Ihrer Metadatentabelle in Anführungszeichen (") oder Backticks (`) setzen, da die Abfrage sonst möglicherweise nicht funktioniert.

Weitere Informationen finden Sie unter Abfragen von Amazon-S3-Tabellen mit Athena.

Sie können Abfragen in Athena auch von der Amazon S3 S3-Konsole aus ausführen.

Das folgende Verfahren verwendet die Amazon S3 S3-Konsole, um auf den Athena-Abfrage-Editor zuzugreifen, sodass Sie eine Tabelle mit Amazon Athena abfragen können.

Um eine Metadatentabelle abzufragen
  1. Melden Sie sich bei der an AWS Management Console und öffnen Sie die Amazon S3 S3-Konsole unter https://console.aws.amazon.com/s3/.

  2. Wählen Sie im linken Navigationsbereich Allzweck-Buckets aus.

  3. Wählen Sie auf der Registerkarte Allgemeine Buckets den Bucket aus, der die Metadatenkonfiguration für die Metadatentabelle enthält, die Sie abfragen möchten.

  4. Wählen Sie auf der Seite mit den Bucket-Details die Registerkarte Metadaten aus.

  5. Wählen Sie Tabelle mit Athena abfragen und wählen Sie dann eine der Beispielabfragen für Journal- oder Inventartabellen aus.

  6. Die Amazon Athena Athena-Konsole wird geöffnet und der Athena-Abfrage-Editor wird mit einer für Sie geladenen Beispielabfrage angezeigt. Ändern Sie diese Abfrage nach Bedarf für Ihren Anwendungsfall.

    Im Abfrage-Editor sollte das Feld Katalog mit s3tablescatalog/aws-s3 gefüllt sein. Das Datenbankfeld sollte mit dem Namespace gefüllt werden, in dem Ihre Tabelle gespeichert ist (z. B. b_). general-purpose-bucket-name

    Anmerkung

    Wenn Sie diese Werte in den Feldern Katalog und Datenbank nicht sehen, stellen Sie sicher, dass Sie Ihren AWS verwalteten Tabellen-Bucket mit den AWS Analysediensten in dieser Region integriert haben. Weitere Informationen finden Sie unter Integration von Amazon S3 S3-Tabellen mit AWS Analysediensten.

  7. Wählen Sie dann Run (Ausführen) aus, um die Abfrage auszuführen.

    Anmerkung
    • Wenn Sie die Fehlermeldung „Unzureichende Berechtigungen zum Ausführen der Abfrage“ erhalten. Principal hat keine Rechte für die angegebene Ressource. „Wenn Sie versuchen, eine Abfrage in Athena auszuführen, müssen Ihnen die erforderlichen Lake Formation Formation-Berechtigungen für die Tabelle erteilt werden. Weitere Informationen finden Sie unter Erteilen der Lake Formation Formation-Berechtigung für eine Tabelle oder Datenbank.

      Stellen Sie außerdem sicher, dass Sie über die entsprechenden AWS Identity and Access Management (IAM-) Berechtigungen zum Abfragen von Metadatentabellen verfügen. Weitere Informationen finden Sie unter Berechtigungen für das Abfragen von Metadatentabellen.

    • Wenn Sie beim Versuch, die Abfrage auszuführen, die Fehlermeldung „Iceberg kann nicht auf die angeforderte Ressource zugreifen“ erhalten, rufen Sie die AWS Lake Formation Konsole auf und vergewissern Sie sich, dass Sie sich selbst Berechtigungen für den Tabellen-Bucket-Katalog und die Datenbank (Namespace) erteilt haben, die Sie erstellt haben. Geben Sie bei der Gewährung dieser Berechtigungen keine Tabelle an. Weitere Informationen finden Sie unter Erteilen der Lake Formation Formation-Berechtigung für eine Tabelle oder Datenbank.

Abfragen von Metadatentabellen mit Amazon Redshift

Nachdem Sie Ihre AWS verwalteten S3-Tabellen-Buckets in die AWS Analysedienste integriert haben, gehen Sie wie folgt vor:

  • Erstellen Sie einen Ressourcenlink zu Ihrem Metadatentabellen-Namespace (normalerweiseb_general_purpose_bucket_name).

  • Stellen Sie sicher, dass Sie die Namespace-Namen Ihrer Metadatentabelle in Anführungszeichen (") oder Backticks (`) setzen, da die Abfrage sonst möglicherweise nicht funktioniert.

Danach können Sie mit der Abfrage Ihrer Metadatentabellen in der Amazon Redshift Redshift-Konsole beginnen. Weitere Informationen finden Sie unter Zugreifen auf Amazon-S3-Tabellen mit Amazon Redshift.

Abfragen von Metadatentabellen mit Amazon EMR

Um Ihre Metadatentabellen mithilfe von Amazon EMR abzufragen, erstellen Sie einen Amazon EMR-Cluster, der für Ihre Metadatentabellen konfiguriert ist, Apache Iceberg und stellen mithilfe von eine Verbindung zu Ihren Metadatentabellen her. Apache Spark Sie können dies einrichten, indem Sie Ihre AWS verwalteten S3-Tabellen-Buckets mit AWS Analysediensten integrieren oder den Open-Source-Katalog Amazon S3 S3-Tabellen für Iceberg Kunden verwenden.

Anmerkung

Wenn Sie Apache Spark Amazon EMR oder andere Engines von Drittanbietern verwenden, um Ihre Metadatentabellen abzufragen, empfehlen wir Ihnen, den Iceberg REST-Endpunkt Amazon S3 Tables zu verwenden. Ihre Abfrage wird möglicherweise nicht erfolgreich ausgeführt, wenn Sie diesen Endpunkt nicht verwenden. Weitere Informationen finden Sie unter Zugreifen auf Tabellen mithilfe der Amazon S3 S3-Tabellen Iceberg REST Endpunkt.

Weitere Informationen finden Sie unter Zugreifen auf Amazon-S3-Tabellen mit Amazon EMR.