AWS Glue cas d'utilisation et étapes de haut niveau

Aurora Postgre SQL - Intégration compatible avec AWS Glue

AWS Glue est un service d'extraction, de transformation et de chargement (ETL) entièrement géré pour préparer et charger des données à des fins d'analyse. Vous pouvez intégrer AWS Glue Amazon Aurora Postgre SQL -Compatible Edition pour tous les flux de travail de traitement et d'analyse des données.

AWS Glue cas d'utilisation et étapes de haut niveau

L'intégration d'Aurora Postgre SQL -Compatible with AWS Glue prend en charge les cas d'utilisation suivants :

Entreposage et analyse des données ‒ Utilisez AWS Glue l'intégration avec Aurora Postgre SQL -Compatible pour créer des solutions d'entreposage et d'analyse des données. AWS Glue peut extraire des données de bases de données SQL compatibles Aurora Postgre et les transformer selon vos besoins. AWS Glue Vous pouvez ensuite charger les données transformées dans un entrepôt de données tel qu'Amazon Redshift ou Amazon Athena pour des analyses et des rapports avancés.
Création d'un lac de données ‒ AWS Glue À utiliser pour extraire des données d'Aurora Postgre SQL -Compatible et les charger dans un lac de données stocké dans Amazon S3. Vous pouvez ensuite utiliser ce lac de données à diverses fins, telles que l'apprentissage automatique, l'exploration de données ou l'alimentation d'autres systèmes analytiques.
ETLpipelines ‒ Utilisez le ETL service AWS Glue sans serveur pour créer des pipelines de données robustes. Vous pouvez extraire des données depuis Aurora Postgre SQL -Compatible et effectuer des transformations complexes à l'aide d'Apache Spark ou. PySpark Vous pouvez charger les données traitées dans une cible telle qu'Amazon S3 ou Amazon Redshift, ou vous pouvez les charger à nouveau dans Aurora SQL Postgre -Compatible.
Catalogage des données et gestion des métadonnées ‒ AWS Glue Data Catalog À utiliser pour analyser et cataloguer automatiquement les métadonnées à partir de bases de données et de tables SQL compatibles Aurora Postgre. Services AWS tels qu'Amazon Athena et Amazon Redshift Spectrum peuvent utiliser ce référentiel de métadonnées centralisé pour interroger et analyser des données.
Préparation des données pour l'apprentissage automatique ‒ AWS Glue À utiliser pour préparer les données à partir d'Aurora Postgre SQL -Compatible pour les charges de travail d'apprentissage automatique (ML). Les données traitées peuvent être chargées dans Amazon SageMaker AI ou dans d'autres services de machine learning pour la formation et le déploiement de modèles.
Migration et réplication des données ‒ Bien que AWS Database Migration Service (AWS DMS) soit le service principal pour les migrations de bases de données, vous pouvez également l'utiliser AWS Glue. Migrez ou répliquez des données depuis Aurora Postgre SQL -Compatible vers d'autres magasins de données, tels qu'Amazon S3, Amazon Redshift ou même d'autres moteurs de base de données.

Votre entreprise peut tirer parti de la puissance des services d'intégration et d'analyse de AWS données grâce à l'évolutivité, aux performances et à la compatibilité d'Aurora Postgre -CompatibleSQL. Grâce à ces cas d'utilisation, vous pouvez créer des pipelines de données robustes, effectuer des transformations de données complexes et les intégrer à d'autres Services AWS pour des analyses et des rapports avancés.

Pour intégrer Aurora Postgre SQL -Compatible avec AWS Glue, suivez les étapes de haut niveau suivantes :

Connectez-vous au AWS Management Console, accédez à la AWS Glue console et créez un AWS Glue Data Catalog.

Le catalogue de données est un référentiel central qui stocke les métadonnées relatives à vos sources de données, notamment les bases de données et les SQL tables compatibles Aurora Postgre.
Créez une AWS Glue connexion.

Accédez à la page Connexions et créez une AWS Glue connexion. Sélectionnez Aurora Postgre SQL -Compatible comme type de connexion et fournissez le point de terminaison du cluster Aurora Postgre SQL -Compatible, le nom de la base de données, ainsi que le nom d'utilisateur et le mot de passe de votre base de données.
Explorez la source de données SQL compatible Aurora Postgre.

Accédez à la section Crawlers et créez un robot configuré pour utiliser la connexion que vous avez créée. Spécifiez les noms de base de données et de tables que vous souhaitez analyser et inclure dans le catalogue de données, puis exécutez le robot d'exploration.
Créez et exécutez une AWS Glue ETL tâche.

Accédez à la section Tâches et créez une ETL tâche pour accéder aux données de la base de données SQL compatible Aurora Postgre et les interroger à l'aide du catalogue de données. Choisissez le type de poste en fonction de vos besoins. Dans le script de ETL tâche, effectuez les transformations ou traitements nécessaires et spécifiez l'emplacement cible des données traitées. L'emplacement cible peut être Amazon S3, Amazon Redshift ou une autre base de données compatible avec Aurora PostgreSQL.

Pour obtenir des instructions détaillées, consultez la AWS Glue documentation.

Avertissement JavaScript est désactivé ou n'est pas disponible dans votre navigateur.

Pour que vous puissiez utiliser la documentation AWS, Javascript doit être activé. Vous trouverez des instructions sur les pages d'aide de votre navigateur.

Conventions de rédaction

AWS DMS intégration

Intégration Amazon Redshift