Passaggio 4: configura le autorizzazioni per una tabella Delta Lake - AWS Lake Formation

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Passaggio 4: configura le autorizzazioni per una tabella Delta Lake

In questa sezione, imparerai come creare una tabella Delta Lake con il file manifest symlink nel file AWS Glue Data Catalog, impostare le autorizzazioni per i dati AWS Lake Formation e interrogare i dati utilizzando Amazon Athena.

Per creare una tabella Delta Lake

In questo passaggio, eseguirai un AWS Glue processo che crea una tabella transazionale Delta Lake nel Data Catalog.

  1. Accedi alla AWS Glue console all'indirizzo https://console.aws.amazon.com/glue/ nella regione Stati Uniti orientali (Virginia settentrionale)

    come utente amministratore del data lake.

  2. Scegli i lavori dal riquadro di navigazione a sinistra.

  3. Seleziona native-delta-create.

  4. In Azioni, scegli Modifica lavoro.

  5. In Dettagli Job, espandi Proprietà avanzate e seleziona la casella accanto a Usa AWS Glue Data Catalog come metastore Hive per aggiungere i metadati della tabella in. AWS Glue Data Catalog Questo specifica AWS Glue Data Catalog come metastore per le risorse del Data Catalog utilizzate nel job e consente di applicare successivamente le autorizzazioni di Lake Formation alle risorse del catalogo.

  6. Selezionare Salva.

  7. Scegli Esegui in Azioni.

    Questo lavoro crea una tabella Delta Lake denominata product nel lfdeltadb database. Verifica la product tabella nella console Lake Formation.

Per registrare la posizione dei dati con Lake Formation

Successivamente, registra il percorso Amazon S3 come posizione principale del tuo data lake.

  1. Apri la console Lake Formation all'indirizzo https://console.aws.amazon.com/lakeformation/, l'utente amministratore del data lake.

  2. Nel pannello di navigazione, sotto Registra e inserisci, scegli Posizione dei dati.

  3. In alto a destra della console, scegli Registra posizione.

  4. Nella pagina Registra posizione, inserisci quanto segue:

    • Percorso Amazon S3: scegli Sfoglia e seleziona. lf-otf-datalake-123456789012 Fai clic sulla freccia destra (>) accanto alla posizione principale di Amazon S3 per accedere alla s3/buckets/lf-otf-datalake-123456789012/transactionaldata/native-delta posizione.

    • Ruolo IAM: scegli LF-OTF-RegisterRole come ruolo IAM.

    • Scegli la posizione di registrazione.

Per concedere le autorizzazioni del data lake sulla tabella Delta Lake

In questo passaggio, concederemo le autorizzazioni del data lake all'utente business analyst.

  1. In Autorizzazioni Data lake, scegli Concedi.

  2. Nella schermata Concedi le autorizzazioni per i dati, scegli, utenti e ruoli IAM.

  3. lf-consumer-analystuserdal menu a discesa.

  4. Scegli la risorsa Named data catalog.

  5. Per Database sceglilfdeltadb.

  6. Per Tabelle, scegliproduct.

  7. Successivamente, puoi concedere l'accesso basato su colonne specificando le colonne.

    1. In Autorizzazioni per la tabella, scegli Seleziona.

    2. In Autorizzazioni dati, scegli Accesso basato su colonne, scegli Includi colonne.

    3. Scegliproduct_name, e colonneprice. category

    4. Scegli Concessione.

Per interrogare la tabella Delta Lake usando Athena

Ora iniziate a interrogare la tabella Delta Lake che avete creato usando Athena. Se è la prima volta che esegui query in Athena, devi configurare una posizione dei risultati della query. Per ulteriori informazioni, vedere Specificazione della posizione dei risultati di una query.

  1. Esci come utente amministratore del data lake e accedi come BusinessAnalystUser nella regione Stati Uniti orientali (Virginia settentrionale) utilizzando la password indicata in precedenza nell' AWS CloudFormation output.

  2. Aprire la console Athena all'indirizzo https://console.aws.amazon.com/athena/.

  3. Scegli Impostazioni e seleziona Gestisci.

  4. Nella casella Posizione dei risultati della query, inserisci il percorso del bucket che hai creato negli AWS CloudFormation output. Copia il valore di AthenaQueryResultLocation (s3://lf-otf-tutorial-123456789012/athena-results/) e salva.

  5. Esegui la seguente query per visualizzare in anteprima 10 record memorizzati nella tabella Delta Lake:

    select * from lfdeltadb.product limit 10;

    Per ulteriori informazioni sull'interrogazione delle tabelle Delta Lake, consulta la sezione Interrogazione delle tabelle Delta Lake nella Guida per l'utente di Amazon Athena.