Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
Accedere ai permessi di Lake Formation
AWS Lake Formation utilizza AWS Glue Data Catalog (Data Catalog) per archiviare i metadati per i data lake Amazon S3 e le fonti di dati esterne come Amazon Redshift sotto forma di cataloghi, database e tabelle. I metadati nel Data Catalog sono organizzati in una gerarchia di dati a tre livelli che comprende cataloghi, database e tabelle. Organizza i dati provenienti da varie fonti in contenitori logici chiamati cataloghi. I database sono raccolte di tabelle. Il Data Catalog contiene anche collegamenti a risorse, che sono collegamenti a database e tabelle condivisi in account esterni e vengono utilizzati per l'accesso tra account diversi ai dati nel data lake. Ogni AWS account dispone di un catalogo dati per AWS regione.
Lake Formation fornisce un modello di autorizzazioni del sistema di gestione dei database relazionali (RDBMS) per concedere o revocare l'accesso a cataloghi, database, tabelle e colonne nel Data Catalog con i dati sottostanti in Amazon S3.
Prima di conoscere i dettagli del modello di autorizzazioni di Lake Formation, è utile esaminare le seguenti informazioni di base:
-
I data lake gestiti da Lake Formation risiedono in luoghi designati in Amazon Simple Storage Service (Amazon S3). Il Data Catalog contiene anche oggetti di catalogo. Ogni catalogo rappresenta dati provenienti da fonti come data warehouse Amazon Redshift, Amazon DynamoDB database e fonti di dati di terze parti come Snowflake, MySQL e oltre 30 fonti di dati esterne, integrate tramite connettori federati.
-
Lake Formation gestisce un Data Catalog che contiene metadati sui dati di origine da importare nei tuoi data lake, come i dati nei log e nei database relazionali, e sui dati nei tuoi data lake in Amazon S3. Il catalogo dati contiene anche metadati sui dati provenienti da fonti di dati esterne diverse da Amazon S3. I metadati sono organizzati in cataloghi, database e tabelle. Le tabelle di metadati contengono schema, posizione, partizionamento e altre informazioni sui dati che rappresentano. I database di metadati sono raccolte di tabelle.
-
Il Lake Formation Data Catalog è lo stesso Data Catalog utilizzato daAWS Glue. Puoi utilizzare AWS Glue i crawler per creare tabelle del Data Catalog e puoi utilizzare i processi di AWS Glue estrazione, trasformazione e caricamento (ETL) per popolare i dati sottostanti nei tuoi data lake.
-
I cataloghi, i database e le tabelle del Data Catalog sono denominati risorse del Data Catalog. Le tabelle nel catalogo dati vengono chiamate tabelle di metadati per distinguerle dalle tabelle nelle fonti di dati o dai dati tabulari in Amazon S3. I dati a cui puntano le tabelle di metadati in Amazon S3 o nelle fonti di dati vengono definiti dati sottostanti.
-
Un principale è un utente o un ruolo, un QuickSight utente o gruppo Amazon, un utente o un gruppo che si autentica con Lake Formation tramite un provider SAML o, per il controllo degli accessi tra account, ID AWS account, ID organizzazione o ID unità organizzativa.
-
AWS Gluei crawler creano tabelle di metadati, ma puoi anche creare manualmente tabelle di metadati con la console Lake Formation, l'API o (). AWS Command Line Interface AWS CLI Quando crei una tabella di metadati, devi specificare una posizione. Quando si crea un database, la posizione è facoltativa. Le posizioni delle tabelle possono essere posizioni Amazon S3 o posizioni di origini dati come un database Amazon Relational Database Service (Amazon RDS). Le posizioni dei database sono sempre sedi Amazon S3.
-
I servizi che si integrano con Lake Formation, come Amazon Athena e Amazon Redshift, possono accedere al Data Catalog per ottenere metadati e verificare l'autorizzazione per l'esecuzione di query. Per un elenco completo dei servizi integrati, consulta. AWS integrazioni di servizi con Lake Formation