As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.
Definir crawlers no AWS Glue
Você pode usar um crawler para preencher o AWS Glue Data Catalog com tabelas. Este é o principal método usado pela maioria dos usuários do AWS Glue. Um crawler pode rastrear vários armazenamentos de dados em uma única execução. Após a conclusão, o crawler cria ou atualiza uma ou mais tabelas no Data Catalog. As tarefas de extração, transformação e carregamento (ETL) que você define no AWS Glue usam essas tabelas do Data Catalog como fontes e destinos. O trabalho de ETL lê e grava os armazenamentos de dados que são especificados nas tabelas do Data Catalog de fonte e de destino.
Para obter mais informações sobre como usar o console do AWS Glue para adicionar um crawler, consulte Trabalhar com crawlers no console do AWS Glue.
Tópicos
- Quais armazenamentos de dados posso rastrear?
- Como funcionam os crawlers
- Pré-requisitos do crawler
- Propriedades do crawler
- Definir opções de configuração do crawler
- Programar um crawler do AWS Glue
- Trabalhar com crawlers no console do AWS Glue
- Acelerar crawls usando notificações de eventos do Amazon S3
- Usar criptografia com o crawler de eventos do Amazon S3
- Parâmetros definidos nas tabelas do Data Catalog pelo crawler