Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
Aurora SQL Postgre -Integrazione compatibile con AWS Glue
AWS Glue è un servizio di estrazione, trasformazione e caricamento (ETL) completamente gestito per la preparazione e il caricamento dei dati per l'analisi. Puoi integrarti AWS Glue con Amazon Aurora Postgre SQL -Compatible Edition per qualsiasi flusso di lavoro di elaborazione e analisi dei dati.
AWS Glue casi d'uso e passaggi di alto livello
Integrazione di Aurora Postgre SQL -Compatibile con AWS Glue supporta i seguenti casi d'uso:
-
Data warehousing e analisi ‒ Utilizza l' AWS Glue integrazione con Aurora SQL Postgre -Compatible per creare soluzioni di data warehousing e analisi. AWS Glue può estrarre dati da database SQL compatibili con Aurora Postgre e trasformarli in base alle proprie esigenze. Quindi AWS Glue puoi caricare i dati trasformati in un data warehouse come Amazon Redshift o Amazon Athena per analisi e report avanzati.
-
Creazione di data lake ‒ Utilizzabile AWS Glue per estrarre dati da Aurora Postgre SQL -Compatible e caricarli in un data lake archiviato in Amazon S3. È quindi possibile utilizzare questo data lake per vari scopi, come l'apprendimento automatico, l'esplorazione dei dati o l'alimentazione di altri sistemi analitici.
-
ETLpipeline ‒ Utilizza il ETL servizio AWS Glue serverless per creare solide pipeline di dati. È possibile estrarre dati da Aurora Postgre SQL -Compatible ed eseguire trasformazioni complesse utilizzando Apache Spark o. PySpark Puoi caricare i dati elaborati in una destinazione come Amazon S3 o Amazon Redshift oppure caricarli nuovamente in Aurora Postgre -Compatible. SQL
-
Catalogazione dei dati e gestione dei metadati ‒ Utilizzato per eseguire automaticamente AWS Glue Data Catalog la scansione e catalogare i metadati da database e tabelle compatibili con SQL Aurora Postgre. Servizi AWS come Amazon Athena e Amazon Redshift Spectrum possono utilizzare questo repository di metadati centralizzato per interrogare e analizzare i dati.
-
Preparazione dei dati per l'apprendimento automatico ‒ Utilizzabile AWS Glue per preparare i dati da Aurora Postgre, SQL compatibile per carichi di lavoro di machine learning (ML). I dati elaborati possono essere caricati in Amazon SageMaker AI o altri servizi ML per la formazione e la distribuzione di modelli.
-
Migrazione e replica dei dati ‒ Sebbene AWS Database Migration Service (AWS DMS) sia il servizio principale per le migrazioni di database, puoi anche utilizzarlo. AWS Glue Migra o replica i dati da Aurora Postgre SQL -Compatibile con altri archivi di dati, come Amazon S3, Amazon Redshift o persino altri motori di database.
La tua organizzazione può sfruttare la potenza dei servizi di integrazione e analisi AWS dei dati con la scalabilità, le prestazioni e la compatibilità di SQL Aurora Postgre -Compatible. Con questi casi d'uso, puoi creare solide pipeline di dati, eseguire trasformazioni di dati complesse e integrarti con altri per analisi e report avanzati. Servizi AWS
Per integrare Aurora Postgre SQL -Compatible con AWS Glue, utilizza i seguenti passaggi di alto livello:
-
Accedi a AWS Management Console, vai alla AWS Glue console e crea un. AWS Glue Data Catalog
Data Catalog è un repository centrale che archivia i metadati sulle fonti di dati, inclusi database e tabelle compatibili con Aurora SQL Postgre.
-
Crea una connessione. AWS Glue
Vai alla pagina Connessioni e crea una AWS Glue connessione. Seleziona Aurora Postgre SQL -Compatible come tipo di connessione e fornisci l'endpoint del cluster Aurora Postgre SQL -Compatible, il nome del database e il nome utente e la password del database.
-
Esegui la scansione dell'origine dati compatibile con Aurora SQL Postgre.
Vai alla sezione Crawler e crea un crawler configurato per utilizzare la connessione che hai creato. Specificate i nomi dei database e delle tabelle che desiderate scansionare e includere nel Data Catalog, quindi eseguite il crawler.
-
Crea ed esegui un processo. AWS Glue ETL
Vai alla sezione Lavori e crea un ETL lavoro per accedere e interrogare i dati dal database Aurora Postgre SQL -Compatible utilizzando il Data Catalog. Scegli il tipo di lavoro in base alle tue esigenze. Nello script del ETL job, eseguite le trasformazioni o le elaborazioni necessarie e specificate la posizione di destinazione per i dati elaborati. La posizione di destinazione può essere Amazon S3, Amazon Redshift o un altro database compatibile con Aurora Postgre. SQL
Per istruzioni dettagliate, consulta la documentazione.AWS Glue