As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.
Aurora Postgre SQL — Integração compatível com AWS Glue
AWS Glue é um serviço totalmente gerenciado de extração, transformação e carregamento (ETL) para preparar e carregar dados para análise. Você pode fazer a integração AWS Glue com o Amazon Aurora Postgre SQL -Compatible Edition para qualquer fluxo de trabalho de processamento e análise de dados.
AWS Glue casos de uso e etapas de alto nível
Integração do Aurora Postgre SQL — Compatível com AWS Glue suporta os seguintes casos de uso:
-
Armazenamento e análise de dados ‒ Use a AWS Glue integração com o Aurora SQL Postgre -Compatível para criar soluções de armazenamento e análise de dados. AWS Glue pode extrair dados de bancos de dados SQL compatíveis com o Aurora Postgre e transformá-los de acordo com suas necessidades. Em seguida, AWS Glue pode carregar os dados transformados em um data warehouse, como o Amazon Redshift ou o Amazon Athena, para análises e relatórios avançados.
-
Criação de data lake ‒ Use AWS Glue para extrair dados do Aurora, SQL compatível com Postgre, e carregá-los em um data lake armazenado no Amazon S3. Em seguida, você pode usar esse data lake para várias finalidades, como aprendizado de máquina, exploração de dados ou alimentação de outros sistemas analíticos.
-
ETLpipelines ‒ Use o ETL serviço AWS Glue sem servidor para criar pipelines de dados robustos. Você pode extrair dados do Aurora Postgre SQL -Compatível e realizar transformações complexas usando o Apache Spark ou. PySpark Você pode carregar os dados processados em um destino, como o Amazon S3 ou o Amazon Redshift, ou carregá-los de volta no Aurora, compatível com Postgre. SQL
-
Catalogação de dados e gerenciamento de metadados ‒ Use AWS Glue Data Catalog para rastrear e catalogar automaticamente metadados de bancos de dados e tabelas compatíveis com o Aurora Postgre. SQL Serviços da AWS como o Amazon Athena e o Amazon Redshift Spectrum, podem usar esse repositório centralizado de metadados para consultar e analisar dados.
-
Preparação de dados para aprendizado de máquina ‒ Use AWS Glue para preparar dados do Aurora Postgre SQL -Compatível com cargas de trabalho de aprendizado de máquina (ML). Os dados processados podem ser carregados no Amazon SageMaker AI ou em outros serviços de ML para treinamento e implantação de modelos.
-
Migração e replicação de dados ‒ Embora AWS Database Migration Service (AWS DMS) seja o principal serviço para migrações de banco de dados, você também pode usar. AWS Glue Migre ou replique dados do Aurora Postgre SQL — Compatível com outros armazenamentos de dados, como Amazon S3, Amazon Redshift ou até mesmo outros mecanismos de banco de dados.
Sua organização pode usar o poder dos serviços de integração e análise de AWS dados com a escalabilidade, o desempenho e a compatibilidade do Aurora SQL Postgre -Compatível. Com esses casos de uso, você pode criar pipelines de dados robustos, realizar transformações de dados complexas e integrar-se a outros Serviços da AWS para análises e relatórios avançados.
Para integrar o Aurora Postgre SQL — compatível com AWS Glue, use as seguintes etapas de alto nível:
-
Faça login no AWS Management Console, navegue até o AWS Glue console e crie um AWS Glue Data Catalog.
O Catálogo de Dados é um repositório central que armazena metadados sobre suas fontes de dados, incluindo bancos de dados e tabelas compatíveis com o Aurora PostgreSQL.
-
Crie uma AWS Glue conexão.
Navegue até a página Conexões e crie uma AWS Glue conexão. Selecione Aurora Postgre SQL -Compatível como o tipo de conexão e forneça o endpoint de cluster SQL compatível com Aurora Postgre, o nome do banco de dados e o nome de usuário e senha do seu banco de dados.
-
Rastreie a fonte de dados compatível com o Aurora Postgre. SQL
Navegue até a seção Rastreadores e crie um rastreador configurado para usar a conexão que você criou. Especifique os nomes do banco de dados e da tabela que você deseja rastrear e incluir no Catálogo de Dados e execute o rastreador.
-
Crie e execute um AWS Glue ETL trabalho.
Navegue até a seção Trabalhos e crie um ETL trabalho para acessar e consultar dados do banco de dados SQL compatível com o Aurora Postgre usando o Catálogo de Dados. Escolha o tipo de trabalho com base em seus requisitos. No script do ETL trabalho, execute todas as transformações ou processamentos necessários e especifique o local de destino para os dados processados. O local de destino pode ser Amazon S3, Amazon Redshift ou outro banco de dados compatível com o Aurora Postgre. SQL
Para obter instruções detalhadas, consulte a AWS Glue documentação.