Integração a outros serviços da AWS - AWS Glue

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Integração a outros serviços da AWS

Embora você possa usar Crawler do AWS Glues para preencher o AWS Glue Data Catalog, há vários serviços da AWS que podem se integrar e preencher automaticamente o catálogo para você. As seções a seguir fornecem mais informações sobre os casos de uso específicos aceitos por serviços da AWS que podem preencher o Catálogo de dados.

AWS Lake Formation

O AWS Lake Formation é um serviço que facilita configurar um data lake seguro na AWS. O Lake Formation é construído sobre a plataforma AWS Glue, e tanto ele quanto o AWS Glue compartilham o mesmo AWS Glue Data Catalog. Você pode registrar sua localização de dados do Amazon S3 com o Lake Formation e usar o console do Lake Formation para criar bancos de dados e tabelas no Catálogo de Dados do AWS Glue, definir políticas de acesso aos dados e auditar o acesso aos dados em seu data lake desde um local central. Você pode usar o controle de acesso refinado do Lake Formation para gerenciar seus recursos existentes do catálogo de dados e os locais de dados do Amazon S3.

Com os dados registrados no Lake Formation, você pode compartilhar com segurança os recursos do Catálogo de Dados entre as entidades principais do IAM, contas da AWS, organizações da AWS e unidades organizacionais.

Para obter mais informações sobre a criação de recursos do Catálogo de Dados usando o Lake Formation, consulte Criar tabelas e bancos de dados do Catálogo de Dados no Guia do desenvolvedor do AWS Lake Formation.

Amazon Athena

O Amazon Athena usa o Catálogo de Dados para armazenar e recuperar metadados de tabela para os dados do Amazon S3 em sua conta da AWS. Os metadados da tabela permitem que o mecanismo de consulta do Athena saiba como localizar, ler e processar os dados que você deseja consultar.

Você pode preencher o AWS Glue Data Catalog usando diretamente as instruções CREATE TABLE do Athena. É possível definir e preencher manualmente os metadados do esquema e de partição no Catálogo de Dados sem precisar executar um crawler.

  1. No console do Athena, crie um banco de dados que armazenará os metadados da tabela no Catálogo de Dados.

  2. Use a instrução CREATE EXTERNAL TABLE para definir o esquema da sua fonte de dados.

  3. Use a cláusula PARTITIONED BY para definir quaisquer chaves de partição se seus dados estiverem particionados.

  4. Use a cláusula LOCATION para especificar o caminho do Amazon S3 em que seus arquivos de dados reais são armazenados.

  5. Execute a instrução CREATE TABLE.

    Essa consulta cria os metadados da tabela no Catálogo de Dados com base no esquema e nas partições definidos, sem realmente fazer o crawling dos dados.

Você pode consultar a tabela no Athena e ela usará os metadados do Catálogo de Dados para acessar e consultar seus arquivos de dados no Amazon S3.

Para obter mais informações, consulte Criar bancos de dados e tabelas no Guia do usuário do Amazon Athena.