Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
Utilizzo di connettori e connessioni personalizzati con AWS Glue Studio
AWS Gluefornisce supporto integrato per gli archivi di dati più utilizzati (come Amazon Aurora Amazon Redshift, Microsoft SQL Server, My, SQL MongoDB e Postgre) tramite connessioni. SQL JDBC AWS Glueconsente inoltre di utilizzare JDBC driver personalizzati nei processi di estrazione, trasformazione e caricamento (). ETL Per gli archivi dati non supportati in modo nativo, ad esempio le applicazioni SaaS, è possibile utilizzare i connettori.
Un connettore è un pacchetto di codice opzionale che aiuta con l'accesso ai datastore in AWS Glue Studio. Puoi iscriverti a diversi connettori offerti in Marketplace AWS.
Quando si creano ETL lavori, è possibile utilizzare un archivio dati supportato in modo nativo, un connettore di Marketplace AWS o connettori personalizzati. Se utilizzi un connettore, è innanzitutto necessario creare una connessione. Una connessione contiene le proprietà necessarie per connettersi a un particolare datastore. Si utilizza la connessione con le fonti di dati e le destinazioni di dati nel ETL job. Connettori e connessioni funzionano insieme per facilitare l'accesso ai datastore.
Le seguenti connessioni sono disponibili durante la creazione di connessioni per connettori:
-
Amazon Aurora— un motore di database relazionale scalabile e ad alte prestazioni con sicurezza, backup e ripristino integrati e accelerazione in memoria.
-
Amazon DocumentDB: un servizio di database di documenti scalabile, altamente disponibile e completamente gestito che supporta MongoDB e. SQL APIs
-
Amazon Redshift— un servizio di database di documenti scalabile, altamente disponibile e completamente gestito che supporta MongoDB e. SQL APIs
-
Azure SQL: un servizio di database relazionale basato su cloud di Microsoft Azure che offre funzionalità di archiviazione e gestione dei dati scalabili, affidabili e sicure.
-
Cosmos DB: un servizio di database cloud distribuito a livello globale di Microsoft Azure che offre funzionalità di archiviazione e interrogazione di dati scalabili e ad alte prestazioni.
-
Google BigQuery: un data warehouse cloud senza server per eseguire query veloci su set di dati di grandi dimensioni. SQL
-
JDBC— un sistema di gestione di database relazionali (RDBMS) che utilizza Java API per connettersi e interagire con le connessioni dati.
-
Kafka: una piattaforma di elaborazione di flussi open-source, utilizzata per lo streaming e la messaggistica di dati in tempo reale.
-
MariaDB: un fork di SQL My sviluppato dalla community che offre prestazioni, scalabilità e funzionalità migliorate.
-
MongoDB: un database orientato ai documenti multipiattaforma che offre scalabilità, flessibilità e prestazioni elevate.
-
MongoDB Atlas: un'offerta di database as a service (DBaaS) basata su cloud di MongoDB che semplifica la gestione e la scalabilità delle implementazioni di MongoDB.
-
Microsoft SQL Server: un sistema di gestione di database relazionali (RDBMS) di Microsoft che offre solide funzionalità di archiviazione, analisi e reporting dei dati.
-
My SQL: un sistema di gestione di database relazionali open source (RDBMS) ampiamente utilizzato nelle applicazioni Web ed è noto per la sua affidabilità e scalabilità.
-
Rete: un'origine dati di rete rappresenta una risorsa o un servizio accessibile in rete a cui è possibile accedere tramite una piattaforma di integrazione dei dati.
-
OpenSearch— una fonte di OpenSearch dati è un'applicazione in OpenSearch grado di connettersi e importare dati da.
-
Oracle: un sistema di gestione di database relazionali (RDBMS) di Oracle Corporation che offre solide funzionalità di archiviazione, analisi e reporting dei dati.
-
Postgre SQL: un sistema di gestione di database relazionali open source (RDBMS) che offre solide funzionalità di archiviazione, analisi e reporting dei dati.
-
Salesforce: Salesforce fornisce un software per la gestione delle relazioni con i clienti (CRM) che ti aiuta nelle vendite, nell'assistenza clienti, nell'e-commerce e altro ancora. Se sei un utente Salesforce, puoi connetterti al tuo account Salesforce. AWS Glue Quindi, puoi utilizzare Salesforce come fonte o destinazione di dati per i tuoi lavori. ETL Esegui questi processi per trasferire dati tra Salesforce e i AWS servizi o altre applicazioni supportate.
-
SAPHANA— un database e una piattaforma di analisi in memoria che fornisce elaborazione rapida dei dati, analisi avanzate e integrazione dei dati in tempo reale.
-
Snowflake: un data warehouse basato su cloud che fornisce servizi di archiviazione e analisi dei dati scalabili e ad alte prestazioni.
-
Teradata: un sistema di gestione di database relazionali (RDBMS) che offre funzionalità di archiviazione, analisi e reporting dei dati ad alte prestazioni.
-
Vertica: un data warehouse analitico orientato alle colonne progettato per l'analisi di big data che offre prestazioni di query rapide, analisi avanzate e scalabilità.