Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
Definición de rastreadores en AWS Glue
Puede usar un rastreador para rellenar el AWS Glue Data Catalog con tablas. Este es el método principal usado por la mayoría de los usuarios de AWS Glue. Un rastreador puede rastrear varios almacenes de datos en una única ejecución. Cuando finaliza, el rastreador crea o actualiza una o varias tablas del Catálogo de datos. Los trabajos de extracción, transformación y carga (ETL) que define en AWS Glue usan estas tablas del Catálogo de datos como orígenes y destinos. El trabajo de ETL lee y escribe en los almacenes de datos que se especifican en las tablas de origen y destino del Catálogo de datos.
Para obtener más información acerca de cómo usar la consola de AWS Glue para añadir un rastreador, consulte Trabajo con rastreadores en la consola de AWS Glue.
Temas
- ¿Qué almacenes de datos puedo rastrear?
- Funcionamiento de los rastreadores
- Requisitos previos del rastreador
- Propiedades del rastreador
- Opciones de configuración de rastreadores
- Programación de un rastreador de AWS Glue
- Trabajo con rastreadores en la consola de AWS Glue
- Aceleración de los rastreadores mediante las notificaciones de eventos de Amazon S3
- Uso del cifrado con el rastreador de eventos de Amazon S3
- Parámetros establecidos en las tablas del catálogo de datos por el rastreador