Voraussetzungen für die Verbindung des Datenkatalogs mit dem Hive-Metastore - AWS Lake Formation

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Voraussetzungen für die Verbindung des Datenkatalogs mit dem Hive-Metastore

Um eine Verbindung mit einem externen Apache Hive-Metastore herzustellen und Datenzugriffsberechtigungen einzurichten, müssen Sie die folgenden Anforderungen erfüllen: AWS Glue Data Catalog

Anmerkung

Wir empfehlen, dass ein Lake Formation-Administrator die AWS SAM Anwendung bereitstellt und nur ein privilegierter Benutzer die Hive-Metastore-Verbindung verwendet, um die entsprechenden Verbunddatenbanken zu erstellen.

  1. Erstellen Sie IAM-Rollen.
    Um die Anwendung bereitzustellen AWS SAM
    • Erstellen Sie eine Rolle, die über die erforderlichen Berechtigungen für die Bereitstellung von Ressourcen (Lambda-Funktion Amazon API Gateway, IAM-Rolle und die AWS Glue Verbindung) verfügt, die für die Herstellung einer Verbindung zum Hive-Metastore erforderlich sind.

    Um föderierte Datenbanken zu erstellen

    Die folgenden Berechtigungen sind für Ressourcen erforderlich:

    • glue:CreateDatabase on resource arn:aws:glue:region:account-id:database/gluedatabasename

    • glue:PassConnection on resource arn:aws:glue:region:account-id:connection/hms_connection

  2. Registrieren Sie den Amazon S3 S3-Standort bei Lake Formation.

    Um Lake Formation zur Verwaltung und Sicherung der Daten in Ihrem Data Lake zu verwenden, müssen Sie den Amazon S3 S3-Standort, der die Daten für Tabellen im Hive-Metastore enthält, bei Lake Formation registrieren. Auf diese Weise kann Lake Formation Anmeldeinformationen an AWS Analysedienste wie Athena, Redshift Spectrum und Amazon EMR weitergeben.

    Weitere Informationen zur Registrierung eines Amazon S3 S3-Standorts finden Sie unterHinzufügen eines Amazon S3 S3-Standorts zu Ihrem Data Lake.

    Wenn Sie den Amazon S3 S3-Standort registrieren, aktivieren Sie das Kontrollkästchen Enable Data Catalog Federation, damit Lake Formation eine Rolle für den Zugriff auf Tabellen in einer Verbunddatenbank übernehmen kann.

    Register location form for AWS Lake Formation with Amazon S3 path and IAM role options.

    Weitere Informationen zur Registrierung eines Datenstandorts bei Lake Formation finden Sie unterKonfigurieren Sie einen Amazon S3 S3-Standort für Ihren Data Lake.

  3. Verwenden Sie die richtige Amazon EMR-Version.

    Um Amazon EMR mit den verbundenen Hive-Metastore-Datenbanken verwenden zu können, benötigen Sie Hive Version 3.x oder höher und Amazon EMR Version 6.x oder höher.