Integração com o AWS Glue - Amazon Athena

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Integração com o AWS Glue

O AWS Glue é um serviço de ETL (extração, transformação e carga) totalmente gerenciado que pode categorizar os dados, limpá-los, enriquecê-los e movê-los de forma confiável entre vários armazenamentos de dados. Os crawlers do AWS Glue inferem automaticamente o banco de dados e o esquema da tabela do conjunto de dados, armazenando os metadados associados no Catálogo de dados do AWS Glue.

O Athena oferece suporte nativo à consulta de conjuntos de dados e fontes de dados que são registrados com o Catálogo de dados do AWS Glue. Ao executar consultas em DML (Data Manipulation Language – Linguagem de manipulação de dados) no Athena com o Data Catalog como origem, você está usando o esquema do Data Catalog para derivar informações do conjunto de dados subjacente. Ao executar consultas DDL (Data Definition Language), o esquema que você define é definido no Catálogo de dados do AWS Glue. No Athena, também é possível executar um crawler do AWS Glue em uma fonte de dados para criar um esquema no Catálogo de dados do AWS Glue.

Em regiões onde o AWS Glue tem suporte, o Athena usa o AWS Glue Data Catalog como um local central para armazenar e recuperar metadados da tabela em uma conta da AWS. O Athena o motor de consulta requer metadados de tabela que instruem onde ler dados, como lê-los e outras informações necessárias para processar os dados. O AWS Glue Data Catalog fornece um repositório de metadados unificado em uma grande variedade de fontes e formatos de dados, integrando-se não apenas ao Athena, mas ao Amazon S3, ao Amazon RDS, ao Amazon Redshift, ao Amazon Redshift Spectrum, ao Amazon EMR e a qualquer aplicativo compatível com a metastore do Apache Hive.

Para obter mais informações sobre o AWS Glue Data Catalog, consulte Preencher o AWS Glue Data Catalog no Guia de desenvolvedor do AWS Glue. Para obter uma lista de regiões onde o AWS Glue esteja disponível, consulte Regiões e endpoints na Referência geral da AWS.

Cobranças à parte se aplicam ao AWS Glue. Para obter mais informações, consulte Definição de preço do AWS Glue e Existem cobranças à parte para o AWS Glue? Para obter mais informações sobre os benefícios de como usar o AWS Glue com o Athena, consulte Por que devo atualizar para o AWS Glue Data Catalog?