AWS Glue casi d'uso e passaggi di alto livello

Aurora SQL Postgre -Integrazione compatibile con AWS Glue

AWS Glue è un servizio di estrazione, trasformazione e caricamento (ETL) completamente gestito per la preparazione e il caricamento dei dati per l'analisi. Puoi integrarti AWS Glue con Amazon Aurora Postgre SQL -Compatible Edition per qualsiasi flusso di lavoro di elaborazione e analisi dei dati.

AWS Glue casi d'uso e passaggi di alto livello

Integrazione di Aurora Postgre SQL -Compatibile con AWS Glue supporta i seguenti casi d'uso:

Data warehousing e analisi ‒ Utilizza l' AWS Glue integrazione con Aurora SQL Postgre -Compatible per creare soluzioni di data warehousing e analisi. AWS Glue può estrarre dati da database SQL compatibili con Aurora Postgre e trasformarli in base alle proprie esigenze. Quindi AWS Glue puoi caricare i dati trasformati in un data warehouse come Amazon Redshift o Amazon Athena per analisi e report avanzati.
Creazione di data lake ‒ Utilizzabile AWS Glue per estrarre dati da Aurora Postgre SQL -Compatible e caricarli in un data lake archiviato in Amazon S3. È quindi possibile utilizzare questo data lake per vari scopi, come l'apprendimento automatico, l'esplorazione dei dati o l'alimentazione di altri sistemi analitici.
ETLpipeline ‒ Utilizza il ETL servizio AWS Glue serverless per creare solide pipeline di dati. È possibile estrarre dati da Aurora Postgre SQL -Compatible ed eseguire trasformazioni complesse utilizzando Apache Spark o. PySpark Puoi caricare i dati elaborati in una destinazione come Amazon S3 o Amazon Redshift oppure caricarli nuovamente in Aurora Postgre -Compatible. SQL
Catalogazione dei dati e gestione dei metadati ‒ Utilizzato per eseguire automaticamente AWS Glue Data Catalog la scansione e catalogare i metadati da database e tabelle compatibili con SQL Aurora Postgre. Servizi AWS come Amazon Athena e Amazon Redshift Spectrum possono utilizzare questo repository di metadati centralizzato per interrogare e analizzare i dati.
Preparazione dei dati per l'apprendimento automatico ‒ Utilizzabile AWS Glue per preparare i dati da Aurora Postgre, SQL compatibile per carichi di lavoro di machine learning (ML). I dati elaborati possono essere caricati in Amazon SageMaker AI o altri servizi ML per la formazione e la distribuzione di modelli.
Migrazione e replica dei dati ‒ Sebbene AWS Database Migration Service (AWS DMS) sia il servizio principale per le migrazioni di database, puoi anche utilizzarlo. AWS Glue Migra o replica i dati da Aurora Postgre SQL -Compatibile con altri archivi di dati, come Amazon S3, Amazon Redshift o persino altri motori di database.

La tua organizzazione può sfruttare la potenza dei servizi di integrazione e analisi AWS dei dati con la scalabilità, le prestazioni e la compatibilità di SQL Aurora Postgre -Compatible. Con questi casi d'uso, puoi creare solide pipeline di dati, eseguire trasformazioni di dati complesse e integrarti con altri per analisi e report avanzati. Servizi AWS

Per integrare Aurora Postgre SQL -Compatible con AWS Glue, utilizza i seguenti passaggi di alto livello:

Accedi a AWS Management Console, vai alla AWS Glue console e crea un. AWS Glue Data Catalog

Data Catalog è un repository centrale che archivia i metadati sulle fonti di dati, inclusi database e tabelle compatibili con Aurora SQL Postgre.
Crea una connessione. AWS Glue

Vai alla pagina Connessioni e crea una AWS Glue connessione. Seleziona Aurora Postgre SQL -Compatible come tipo di connessione e fornisci l'endpoint del cluster Aurora Postgre SQL -Compatible, il nome del database e il nome utente e la password del database.
Esegui la scansione dell'origine dati compatibile con Aurora SQL Postgre.

Vai alla sezione Crawler e crea un crawler configurato per utilizzare la connessione che hai creato. Specificate i nomi dei database e delle tabelle che desiderate scansionare e includere nel Data Catalog, quindi eseguite il crawler.
Crea ed esegui un processo. AWS Glue ETL

Vai alla sezione Lavori e crea un ETL lavoro per accedere e interrogare i dati dal database Aurora Postgre SQL -Compatible utilizzando il Data Catalog. Scegli il tipo di lavoro in base alle tue esigenze. Nello script del ETL job, eseguite le trasformazioni o le elaborazioni necessarie e specificate la posizione di destinazione per i dati elaborati. La posizione di destinazione può essere Amazon S3, Amazon Redshift o un altro database compatibile con Aurora Postgre. SQL

Per istruzioni dettagliate, consulta la documentazione.AWS Glue

Avvertimento JavaScript è disabilitato o non è disponibile nel tuo browser.

Per usare la documentazione AWS, JavaScript deve essere abilitato. Consulta le pagine della guida del browser per le istruzioni.

Convenzioni dei documenti

AWS DMS integrazione

Integrazione di Amazon Redshift