Esecuzione di query su dati con query federate in Amazon Redshift - Amazon Redshift

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Esecuzione di query su dati con query federate in Amazon Redshift

L'uso delle query federate in Amazon Redshift consente di eseguire query e analizzare i dati in database operativi, data warehouse e data lake. Con la funzionalità di query federata, è possibile integrare query da Amazon Redshift in tempo reale in database esterni con query in tutti gli ambienti Amazon Redshift ed Amazon S3. Le query federate possono funzionare con database esterni in Amazon RDS for PostgreSQL, Amazon Aurora Edizione compatibile con PostgreSQL, Amazon RDS for MySQL (anteprima) e Amazon Aurora Edizione compatibile con MySQL (anteprima).

Le query federate ti consentono di incorporare dati in tempo reale come parte delle applicazioni di business intelligence (BI) e reporting. Ad esempio, per semplificare l'importazione di dati in Amazon Redshift, è possibile utilizzare query federate per effettuare le seguenti operazioni:

  • Interrogare direttamente i database operativi.

  • Applicare rapidamente le trasformazioni.

  • Caricare i dati nelle tabelle di destinazione senza la necessità di pipeline complesse di estrazione, trasformazione, caricamento (ETL).

Per ridurre lo spostamento dei dati sulla rete e migliorare le prestazioni, Amazon Redshift distribuisce parte del calcolo per le query federate direttamente nei database operativi remoti. Se necessario, per supportare l'esecuzione di queste query, Amazon Redshift utilizza anche la sua capacità di elaborazione parallela.

Quando si eseguono query federate, Amazon Redshift effettua innanzitutto una connessione client all'istanza DB del cluster RDS o Aurora DB dal nodo leader per recuperare i metadati della tabella. Da un nodo di calcolo, Amazon Redshift emette query secondarie con un predicato spinto verso il basso e recupera le righe dei risultati. Quindi Amazon Redshift distribuisce le righe dei risultati tra i nodi di calcolo per ulteriori elaborazioni.

I dettagli sulle query inviate al database Amazon Aurora PostgreSQL o al database Amazon RDS for PostgreSQL vengono registrati nella vista di sistema SVL_FEDERATED_QUERY.