Interrogation de données avec requête fédérée dans Amazon Redshift - Amazon Redshift

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Interrogation de données avec requête fédérée dans Amazon Redshift

Les requêtes fédérées dans Amazon Redshift vous permettent d’interroger et d’analyser des données dans des bases de données opérationnelles, des entrepôts des données et des lacs de données. Avec la fonction Requête fédérée, vous pouvez intégrer des requêtes à partir de données Amazon Redshift en direct dans des bases de données externes avec des requêtes dans vos environnements Amazon Redshift et Amazon S3. Les requêtes fédérées peuvent fonctionner avec des bases de données externes dans Amazon RDS for PostgreSQL, Amazon Aurora Édition compatible avec PostgreSQL, Amazon RDS for MySQL et Amazon Aurora Édition compatible avec PostgreSQL.

Vous pouvez utiliser les requêtes fédérées pour incorporer des données en direct dans le cadre de votre Business Intelligence (BI) et de vos applications de génération de rapports. Par exemple, pour faciliter l’ingestion de données dans Amazon Redshift, vous pouvez utiliser des requêtes fédérées pour effectuer les opérations suivantes :

  • Interroger directement les bases de données opérationnelles.

  • Appliquer rapidement les transformations.

  • Charger les données dans les tables cible sans avoir besoin de pipelines complexes d’extraction, de transformation, de chargement (ETL).

Pour réduire le déplacement des données sur le réseau et améliorer les performances, Amazon Redshift distribue une partie du calcul des requêtes fédérées directement dans les bases de données opérationnelles distantes. Amazon Redshift utilise également sa capacité de traitement parallèle pour prendre en charge l’exécution de ces requêtes, selon les besoins.

Lors de l'exécution de requêtes fédérées, Amazon Redshift établit d'abord une connexion client à l'instance de base de données du cluster de base de données RDS ou Aurora à partir du nœud principal pour récupérer les métadonnées des tables. À partir d’un nœud de calcul, Amazon Redshift émet des sous-requêtes avec un prédicat poussé vers le bas et récupère les lignes de résultat. Amazon Redshift distribue ensuite les lignes de résultat entre les nœuds de calcul pour un traitement ultérieur.

Les détails sur les requêtes envoyées à la base de données Amazon Aurora PostgreSQL ou à la base de données Amazon RDS for PostgreSQL sont journalisés dans la vue système SVL_FEDERATED_QUERY.