Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
Définition de crawlers dans AWS Glue
Vous pouvez utiliser un crawler pour remplir le AWS Glue Data Catalog avec des tables. Il s'agit de la méthode principale employée par la plupart des utilisateurs d'AWS Glue. Un crawler peut analyser plusieurs magasins de données en une seule fois. À la fin de cette opération, l'crawler crée ou met à jour une ou plusieurs tables dans votre Data Catalog. Les tâches Extract-transform-load (ETL) que vous définissez dans AWS Glue utilisent ces tables Data Catalog en tant que sources et cibles. La tâche ETL lit et écrit dans les magasins de données qui sont spécifiés dans les tables Data Catalog sources et cibles.
Pour plus d'informations sur l'utilisation de la console AWS Glue pour ajouter un crawler, consultez Utilisation des crawlers sur la console AWS Glue.
Rubriques
- Quels magasins de données puis-je analyser ?
- Fonctionnement des crawlers
- Prérequis pour le crawler
- Propriétés du crawler
- Configuration des options de configuration du crawler
- Planification d'un crawler AWS Glue
- Utilisation des crawlers sur la console AWS Glue
- Accélération des analyseurs à l'aide des notifications d'événements Amazon S3
- Utilisation du chiffrement avec le crawler d'événements Amazon S3
- Paramètres définis sur les tables du Catalogue de données par un Crawler