Compilazione del catalogo AWS Glue dati - AWS Glue

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Compilazione del catalogo AWS Glue dati

È possibile compilare il file AWS Glue Data Catalog utilizzando i seguenti metodi:

  • Crawler di AWS Glue — An Crawler di AWS Glue può scoprire e catalogare automaticamente fonti di dati come database, data lake e dati in streaming. I crawler sono il metodo più comune e consigliato per popolare il Data Catalog in quanto possono scoprire e dedurre automaticamente i metadati per un'ampia varietà di fonti di dati.

  • Aggiungere manualmente i metadati: puoi definire manualmente database, tabelle e dettagli di connessione e aggiungerli al Data Catalog utilizzando la AWS Glue console, la console Lake Formation o le AWS Glue API. AWS CLI L'immissione manuale è utile quando si desidera catalogare fonti di dati che non possono essere sottoposte a scansione.

  • Integrazione con altri AWS servizi: puoi popolare il Data Catalog con metadati di servizi come Amazon AWS Lake Formation Athena. Questi servizi possono scoprire e registrare fonti di dati nel Data Catalog.

  • Compilazione da un repository di metadati esistente: se disponi di un archivio di metadati esistente come Apache Hive Metastore, puoi utilizzarlo AWS Glue per importare tali metadati nel Data Catalog. Per ulteriori informazioni, consulta Migrazione tra Hive Metastore e on. AWS Glue Data Catalog GitHub