Consultar dados com consultas federadas no Amazon Redshift - Amazon Redshift

Consultar dados com consultas federadas no Amazon Redshift

Usando consultas federadas no Amazon Redshift, você pode consultar e analisar dados em bancos de dados operacionais, data warehouses e data lakes. Com o recurso de consulta federada, você pode integrar consultas do Amazon Redshift em dados ativos em bancos de dados externos com consultas em seus ambientes Amazon Redshift e Amazon S3. As consultas federadas podem funcionar com bancos de dados externos no Amazon RDS for PostgreSQL, Amazon Aurora Edição compatível com PostgreSQL, Amazon RDS for MySQL e Amazon Aurora Edição compatível com MySQL.

Você pode usar consultas federadas para incorporar dados ativos como parte de seus aplicativos de business intelligence (BI) e relatórios. Por exemplo, para facilitar a ingestão de dados para o Amazon Redshift, você pode usar consultas federadas para fazer o seguinte:

  • Consultar bancos de dados operacionais diretamente.

  • Aplicar transformações rapidamente.

  • Carregar dados nas tabelas de destino sem a necessidade de pipelines complexos de extração, transformação e carga (ETL).

Para reduzir a movimentação de dados pela rede e melhorar a performance, o Amazon Redshift distribui parte da computação para consultas federadas diretamente nos bancos de dados operacionais remotos. O Amazon Redshift também usa sua capacidade de processamento paralelo para dar suporte à execução dessas consultas, conforme necessário.

Ao executar consultas federadas, primeiro o Amazon Redshift estabelece uma conexão de cliente com a instância de banco de dados do cluster de banco de dados do RDS ou Aurora pelo nó líder para recuperar metadados da tabela. De um nó de computação, o Amazon Redshift emite subconsultas com um predicado empurrado e recupera as linhas de resultado. O Amazon Redshift então distribui as linhas de resultados para os nós de computação para processamento adicional.

Detalhes sobre consultas enviadas ao banco de dados do Amazon Aurora PostgreSQL ou Amazon RDS for PostgreSQL são registrados na visualização do sistema SVL_FEDERATED_QUERY.