Consulta de datos con consultas federadas en Amazon Redshift - Amazon Redshift

Consulta de datos con consultas federadas en Amazon Redshift

Con las consultas federadas en Amazon Redshift, puede consultar y analizar los datos en bases de datos operativas, almacenamientos de datos y lagos de datos. Gracias a la característica de consulta federada, puede integrar consultas desde Amazon Redshift sobre datos activos en bases de datos externas con consultas en los entornos de Amazon Redshift y Amazon S3. Las consultas federadas pueden utilizarse en bases de datos externas en Amazon RDS for PostgreSQL, la Edición compatible con PostgreSQL de Amazon Aurora, Amazon RDS for MySQL y la Edición compatible con MySQL de Amazon Aurora.

Puede utilizar consultas federadas para incorporar datos en vivo como parte de sus aplicaciones de inteligencia comercial (BI) y de informes. Por ejemplo, para facilitar la ingesta de datos en Amazon Redshift, puede utilizar consultas federadas para hacer lo siguiente:

  • Consultar las bases de datos operativas directamente.

  • Aplicar transformaciones rápidamente.

  • Cargar datos en las tablas de destino sin necesidad de canalizaciones complejas de extracción, transformación y carga (ETL).

Con el objetivo de reducir el movimiento de los datos a través de la red y mejorar el rendimiento, Amazon Redshift distribuye parte del cómputo para consultas federadas directamente en las bases de datos operativas remotas. Además, Amazon Redshift utiliza su capacidad de procesamiento en paralelo para permitir la ejecución de estas consultas, cuando sea necesario.

Cuando se ejecutan consultas federadas, Amazon Redshift primero genera una conexión de cliente a la instancia de base de datos de clúster de RDS o Aurora DB desde el nodo principal para recuperar los metadatos de la tabla. Desde un nodo informático, Amazon Redshift emite subconsultas con un predicado que se delega y recupera las filas de resultados. Luego, Amazon Redshift distribuye las filas de resultados entre los nodos informáticos para continuar su procesamiento.

Se registran los detalles sobre las consultas enviadas a la base de datos de Amazon Aurora PostgreSQL o a la base de datos Amazon RDS for PostgreSQL en la vista SVL_FEDERATED_QUERY del sistema.