Gestione del catalogo dati - AWS Glue

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Gestione del catalogo dati

AWS Glue Data Catalog È un repository di metadati centrale che archivia i metadati strutturali e operativi per i set di dati Amazon S3. La gestione efficace del catalogo dati è fondamentale per mantenere la qualità, le prestazioni, la sicurezza e la governance dei dati.

Comprendendo e applicando queste pratiche di gestione del catalogo dati, puoi garantire che i metadati rimangano accurati, performanti, sicuri e ben governati man mano che il panorama dei dati si evolve.

Questa sezione tratta i seguenti aspetti della gestione del catalogo dati:

  • Aggiornamento dello schema della tabella e delle partizioni Man mano che i dati evolvono, potrebbe essere necessario aggiornare lo schema della tabella o la struttura delle partizioni definiti nel Data Catalog. Per ulteriori informazioni su come effettuare questi aggiornamenti a livello di codice utilizzando l'ETL, vedere. AWS Glue Aggiornamento dello schema e aggiunta di nuove partizioni nel Data Catalog utilizzando processi AWS Glue ETL

  • Gestione delle statistiche sulle colonne: statistiche accurate sulle colonne aiutano a ottimizzare i piani di interrogazione e a migliorare le prestazioni. Per ulteriori informazioni su come generare, aggiornare e gestire le statistiche sulle colonne, vedereOttimizzazione delle prestazioni delle query utilizzando le statistiche delle colonne.

  • Crittografia del catalogo dati Per proteggere i metadati sensibili, puoi crittografare il catalogo dati utilizzando AWS Key Management Service ().AWS KMS Questa sezione spiega come abilitare e gestire la crittografia per il tuo Data Catalog.

  • La protezione del Data Catalog with AWS Lake Formation Lake Formation offre un approccio completo alla sicurezza dei data lake e al controllo degli accessi. Puoi utilizzare Lake Formation per proteggere e gestire l'accesso al tuo Data Catalog e ai dati sottostanti.