Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
Creazione di un data lake da un' AWS CloudTrail origine
Questo tutorial ti guida attraverso le azioni da intraprendere sulla console Lake Formation per creare e caricare il tuo primo data lake da una AWS CloudTrail fonte.
Passaggi di alto livello per la creazione di un data lake
Registra un percorso Amazon Simple Storage Service (Amazon S3) come data lake.
Concedi a Lake Formation le autorizzazioni per scrivere nel Data Catalog e nelle posizioni Amazon S3 nel data lake.
Crea un database per organizzare le tabelle di metadati nel Data Catalog.
Usa un blueprint per creare un flusso di lavoro. Esegui il flusso di lavoro per importare dati da una fonte di dati.
-
Configura le tue autorizzazioni Lake Formation per consentire ad altri di gestire i dati nel Data Catalog e nel data lake.
Configura Amazon Athena per interrogare i dati che hai importato nel tuo data lake Amazon S3.
Per alcuni tipi di data store, configura Amazon Redshift Spectrum per interrogare i dati che hai importato nel tuo data lake Amazon S3.
Argomenti
- Destinatari principali
- Prerequisiti
- Fase 1: Creare un utente analista di dati
- Passaggio 2: Aggiungere le autorizzazioni per leggere i AWS CloudTrail registri al ruolo del flusso di lavoro
- Fase 3: creare un bucket Amazon S3 per il data lake
- Fase 4: Registrare un percorso Amazon S3
- Passaggio 5: concedere le autorizzazioni per la localizzazione dei dati
- Fase 6: Creare un database nel Data Catalog
- Passaggio 7: concedere le autorizzazioni per i dati
- Fase 8: Utilizzare un blueprint per creare un flusso di lavoro
- Passaggio 9: Esegui il flusso di lavoro
- Fase 10: concedere SELECT sui tavoli
- Passaggio 11: interrogare il data lake utilizzando Amazon Athena