Compilazione del catalogo AWS Glue dati

È possibile compilare il file AWS Glue Data Catalog utilizzando i seguenti metodi:

Crawler di AWS Glue — An Crawler di AWS Glue può scoprire e catalogare automaticamente fonti di dati come database, data lake e dati in streaming. I crawler sono il metodo più comune e consigliato per popolare il Data Catalog in quanto possono scoprire e dedurre automaticamente i metadati per un'ampia varietà di fonti di dati.
Aggiungere manualmente i metadati: puoi definire manualmente database, tabelle e dettagli di connessione e aggiungerli al Data Catalog utilizzando la AWS Glue console, la console Lake Formation o AWS Glue APIs. AWS CLI L'immissione manuale è utile quando si desidera catalogare fonti di dati che non possono essere sottoposte a scansione.
Integrazione con altri AWS servizi: puoi popolare il Data Catalog con metadati di servizi come Amazon AWS Lake Formation Athena. Questi servizi possono scoprire e registrare fonti di dati nel Data Catalog.
Compilazione da un repository di metadati esistente: se disponi di un archivio di metadati esistente come Apache Hive Metastore, puoi utilizzarlo AWS Glue per importare tali metadati nel Data Catalog. Per ulteriori informazioni, consulta Migrazione tra Hive Metastore e on. AWS Glue Data Catalog GitHub

Avvertimento JavaScript è disabilitato o non è disponibile nel tuo browser.

Per usare la documentazione AWS, JavaScript deve essere abilitato. Consulta le pagine della guida del browser per le istruzioni.

Scoperta e catalogazione dei dati

Utilizzando un Crawler di AWS Glue