Utilizzo di connettori e connessioni personalizzati con AWS Glue Studio - AWS Aderenza

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Utilizzo di connettori e connessioni personalizzati con AWS Glue Studio

AWS Gluefornisce supporto integrato per gli archivi di dati più utilizzati (come Amazon Aurora Amazon Redshift, Microsoft SQL Server, My, SQL MongoDB e Postgre) tramite connessioni. SQL JDBC AWS Glueconsente inoltre di utilizzare JDBC driver personalizzati nei processi di estrazione, trasformazione e caricamento (). ETL Per gli archivi dati non supportati in modo nativo, ad esempio le applicazioni SaaS, è possibile utilizzare i connettori.

Un connettore è un pacchetto di codice opzionale che aiuta con l'accesso ai datastore in AWS Glue Studio. Puoi iscriverti a diversi connettori offerti in Marketplace AWS.

Quando si creano ETL lavori, è possibile utilizzare un archivio dati supportato in modo nativo, un connettore di Marketplace AWS o connettori personalizzati. Se utilizzi un connettore, è innanzitutto necessario creare una connessione. Una connessione contiene le proprietà necessarie per connettersi a un particolare datastore. Si utilizza la connessione con le fonti di dati e le destinazioni di dati nel ETL job. Connettori e connessioni funzionano insieme per facilitare l'accesso ai datastore.

Le seguenti connessioni sono disponibili durante la creazione di connessioni per connettori:

  • Amazon Aurora— un motore di database relazionale scalabile e ad alte prestazioni con sicurezza, backup e ripristino integrati e accelerazione in memoria.

  • Amazon DocumentDB: un servizio di database di documenti scalabile, altamente disponibile e completamente gestito che supporta MongoDB e. SQL APIs

  • Amazon Redshift— un servizio di database di documenti scalabile, altamente disponibile e completamente gestito che supporta MongoDB e. SQL APIs

  • Azure SQL: un servizio di database relazionale basato su cloud di Microsoft Azure che offre funzionalità di archiviazione e gestione dei dati scalabili, affidabili e sicure.

  • Cosmos DB: un servizio di database cloud distribuito a livello globale di Microsoft Azure che offre funzionalità di archiviazione e interrogazione di dati scalabili e ad alte prestazioni.

  • Google BigQuery: un data warehouse cloud senza server per eseguire query veloci su set di dati di grandi dimensioni. SQL

  • JDBC— un sistema di gestione di database relazionali (RDBMS) che utilizza Java API per connettersi e interagire con le connessioni dati.

  • Kafka: una piattaforma di elaborazione di flussi open-source, utilizzata per lo streaming e la messaggistica di dati in tempo reale.

  • MariaDB: un fork di SQL My sviluppato dalla community che offre prestazioni, scalabilità e funzionalità migliorate.

  • MongoDB: un database orientato ai documenti multipiattaforma che offre scalabilità, flessibilità e prestazioni elevate.

  • MongoDB Atlas: un'offerta di database as a service (DBaaS) basata su cloud di MongoDB che semplifica la gestione e la scalabilità delle implementazioni di MongoDB.

  • Microsoft SQL Server: un sistema di gestione di database relazionali (RDBMS) di Microsoft che offre solide funzionalità di archiviazione, analisi e reporting dei dati.

  • My SQL: un sistema di gestione di database relazionali open source (RDBMS) ampiamente utilizzato nelle applicazioni Web ed è noto per la sua affidabilità e scalabilità.

  • Rete: un'origine dati di rete rappresenta una risorsa o un servizio accessibile in rete a cui è possibile accedere tramite una piattaforma di integrazione dei dati.

  • OpenSearch— una fonte di OpenSearch dati è un'applicazione in OpenSearch grado di connettersi e importare dati da.

  • Oracle: un sistema di gestione di database relazionali (RDBMS) di Oracle Corporation che offre solide funzionalità di archiviazione, analisi e reporting dei dati.

  • Postgre SQL: un sistema di gestione di database relazionali open source (RDBMS) che offre solide funzionalità di archiviazione, analisi e reporting dei dati.

  • Salesforce: Salesforce fornisce un software per la gestione delle relazioni con i clienti (CRM) che ti aiuta nelle vendite, nell'assistenza clienti, nell'e-commerce e altro ancora. Se sei un utente Salesforce, puoi connetterti al tuo account Salesforce. AWS Glue Quindi, puoi utilizzare Salesforce come fonte o destinazione di dati per i tuoi lavori. ETL Esegui questi processi per trasferire dati tra Salesforce e i AWS servizi o altre applicazioni supportate.

  • SAPHANA— un database e una piattaforma di analisi in memoria che fornisce elaborazione rapida dei dati, analisi avanzate e integrazione dei dati in tempo reale.

  • Snowflake: un data warehouse basato su cloud che fornisce servizi di archiviazione e analisi dei dati scalabili e ad alte prestazioni.

  • Teradata: un sistema di gestione di database relazionali (RDBMS) che offre funzionalità di archiviazione, analisi e reporting dei dati ad alte prestazioni.

  • Vertica: un data warehouse analitico orientato alle colonne progettato per l'analisi di big data che offre prestazioni di query rapide, analisi avanzate e scalabilità.