Prerequisiti per connettere il Data Catalog al metastore Hive - AWS Lake Formation

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Prerequisiti per connettere il Data Catalog al metastore Hive

Per connetterlo AWS Glue Data Catalog a un metastore Apache Hive esterno e configurare le autorizzazioni di accesso ai dati, è necessario soddisfare i seguenti requisiti:

Nota

Consigliamo che un amministratore di Lake Formation distribuisca l' AWS SAM applicazione e solo un utente privilegiato utilizzi la connessione metastore Hive per creare i database federati corrispondenti.

  1. Creare ruoli IAM.
    Per distribuire l'applicazione AWS SAM
    • Crea un ruolo con le autorizzazioni necessarie per la distribuzione delle risorse (funzione Lambda Amazon API Gateway, ruolo IAM e AWS Glue connessione) necessarie per creare una connessione al metastore Hive.

    Per creare database federati

    Le seguenti autorizzazioni sono richieste per le risorse:

    • glue:CreateDatabase on resource arn:aws:glue:region:account-id:database/gluedatabasename

    • glue:PassConnection on resource arn:aws:glue:region:account-id:connection/hms_connection

  2. Registra la sede Amazon S3 con Lake Formation.

    Per utilizzare Lake Formation per gestire e proteggere i dati nel tuo data lake, devi registrare la posizione Amazon S3 che contiene i dati per le tabelle nel metastore Hive con Lake Formation. In questo modo, Lake Formation può fornire credenziali per servizi di AWS analisi come Athena, Redshift Spectrum e Amazon EMR.

    Per ulteriori informazioni sulla registrazione di una sede Amazon S3, consulta. Aggiungere una posizione Amazon S3 al tuo data lake

    Quando registri la posizione Amazon S3, seleziona la casella di controllo Enable Data Catalog Federation per consentire a Lake Formation di assumere un ruolo per accedere alle tabelle in un database federato.

    Register location form for AWS Lake Formation with Amazon S3 path and IAM role options.

    Per ulteriori informazioni sulla registrazione di una posizione dati con Lake Formation, vedereConfigura una posizione Amazon S3 per il tuo data lake.

  3. Usa la versione corretta di Amazon EMR.

    Per utilizzare Amazon EMR con i database metastore Hive federati, devi disporre della versione 3.x o successiva di Hive e della versione 6.x o successiva di Amazon EMR.