Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
Utilizzo AWS Lake Formation con Amazon Athena
Amazon Athena è un servizio di query senza server che ti aiuta ad analizzare dati strutturati, semistrutturati e non strutturati archiviati in Amazon S3. È possibile utilizzare Athena SQL per interrogare i dati dai formati di dati CSVJSON, Parquet e Avro. Athena supporta SQL anche formati di tabella come Apache Hive, Apache
Ecco alcuni casi d'uso comuni in cui è possibile utilizzare Lake Formation con Athena.
Utilizza le autorizzazioni di Lake Formation per accedere alle risorse del Data Catalog (database e tabelle) da Athena. È possibile utilizzare il metodo della risorsa denominata o LF-Tags per definire le autorizzazioni su database e tabelle. Per ulteriori informazioni, consultare:
Nota
Le autorizzazioni di Lake Formation si applicano solo quando si utilizza SQL Athena per interrogare i dati di origine da Amazon S3 e i metadati nel Data Catalog.
Athena Spark non supporta l'interrogazione delle tabelle del Data Catalog con autorizzazioni Lake Formation. Le autorizzazioni di Lake Formation supportano operazioni di lettura e scrittura su database e tabelle.
Nota
Non puoi applicare filtri di dati quando usi LF-Tags per gestire le autorizzazioni sulle risorse di Data Catalog.
Controlla i risultati delle query utilizzando Filtri di dati in Lake Formation per proteggere le tabelle nei tuoi data lake Amazon S3 concedendo autorizzazioni a livello di colonna, riga e cella. Consulta la limitazione alla proiezione delle partizioni nella Guida per l'utente di Amazon Athena.
Applica un controllo granulare degli accessi sui dati disponibili per l'utente Athena basato su SAML Athena durante l'esecuzione di query federate.
Athena JDBC e ODBC i driver supportano la configurazione dell'accesso federato all'origine dati utilizzando un Identity Provider (IdP) SAML basato. Usa Amazon QuickSight integrato con Lake Formation con il tuo IAM ruolo, SAML gli utenti o i gruppi esistenti per visualizzare i risultati delle query di Athena.
Nota
Le autorizzazioni di Lake Formation per SAML utenti e gruppi verranno applicate solo quando invii domande ad Athena utilizzando il driver or. JDBC ODBC
Per ulteriori informazioni, consulta Using Lake Formation and the Athena JDBC and ODBC drivers for federated access to Athena.
Nota
Attualmente, l'autorizzazione dell'accesso alle SAML identità in Lake Formation non è supportata nelle seguenti regioni:
-
Medio Oriente (Bahrein) - me-south-1
-
Asia Pacifico (Hong Kong) - ap-east-1
-
Africa (Città del Capo) - af-south-1
-
Cina (Ningxia) - cn-nordovest-1
-
Asia Pacifico (Osaka) - ap-northeast-3
-
Si usa Condivisione dei dati tra account in Lake Formation per interrogare le tabelle in un altro account.
Nota
Per ulteriori informazioni sulle limitazioni relative all'utilizzo delle autorizzazioni di Lake Formation perViews
, consulta Considerazioni e limitazioni.
Support per i formati di tabelle transazionali
L'applicazione delle autorizzazioni Lake Formation consente di proteggere i dati transazionali nei data lake basati su Amazon S3. La tabella seguente elenca i formati di tabelle transazionali supportati nelle autorizzazioni Athena e Lake Formation. Lake Formation applica queste autorizzazioni quando gli utenti di Athena eseguono le loro query.
Formato della tabella | Descrizione e operazioni consentite | Autorizzazioni Lake Formation supportate in Athena |
---|---|---|
Apache Hudi |
Un formato utilizzato per semplificare l'elaborazione incrementale dei dati e lo sviluppo di pipeline di dati. Athena supporta operazioni di creazione e lettura utilizzando i formati di tabella Apache Hudi su set di dati Amazon S3 per i tipi di tabella Hudi Copy on Write (CoW) e Merge On Read (MoR). Athena non supporta le operazioni di scrittura sulle tabelle Hudi. |
Utilizzalo Filtraggio dei dati e sicurezza a livello di cella in Lake Formation per proteggere la tabella Hudi utilizzando le autorizzazioni a livello di tabella, colonna, riga e cella. |
Apache Iceberg |
Un formato di tabella aperta che gestisce grandi raccolte di file sotto forma di tabelle e supporta le moderne operazioni analitiche dei data lake come l'inserimento, l'aggiornamento, l'eliminazione e le query sui viaggi nel tempo a livello di record. |
Sono supportate le autorizzazioni a livello di tabella, colonna, riga e cella. Attualmente, Lake Formation non supporta la gestione delle autorizzazioni su operazioni di scrittura come |
Linux Foundation Delta Lake |
Delta Lake è un progetto open source che aiuta a implementare moderne architetture di data lake comunemente costruite su Amazon S3 o Hadoop Distributed File System (). HDFS Athena supporta le tabelle Delta Lake create utilizzando una definizione di tabella manifest basata su symlink a AWS Glue Data Catalog partire da una tabella Delta Lake. Per ulteriori informazioni, consulta Scansionare le tabelle Delta Lake utilizzando i crawler Athena (versione 3 del motore) supporta la lettura delle tabelle native di Delta Lake. Per ulteriori informazioni, consulta Introduzione al supporto tabellare nativo di Delta Lake con i AWS Glue crawler |
Le autorizzazioni a livello di tabella, colonna, riga e cella sono supportate per le tabelle symlink e le tabelle native di Delta Lake. |
Risorse aggiuntive
Post di blog, video e workshop
-
Interroga un set di dati Apache Hudi in un data lake Amazon S3 con Amazon Athena
-
Crea un data lake Apache Iceberg utilizzando Amazon Athena, EMR Amazon e AWS Glue
Inserisci, aggiorna, elimina su Amazon S3 con Athena e Apache Iceberg
Workshop Lake Formation sul controllo degli accessi basato su LF-tag
sull'interrogazione di un data lake.