Utilice AWS Glue para conectar Athena con los datos que tiene en Amazon S3
Athena utiliza AWS Glue Data Catalog para almacenar metadatos, como nombres de tablas y columnas para los datos almacenados en Amazon S3. Esta información de metadatos se convierte en las tablas de datos, las tablas y las vistas que aparecen en el editor de consultas de Athena.
Al utilizar Athena con el AWS Glue Data Catalog, puede usar AWS Glue para crear las bases de datos y las tablas (esquemas) que consultará en Athena, o bien puede utilizar Athena para crear un esquema y entonces utilizarlo en AWS Glue u otros servicios relacionados.
Para definir la información del esquema para AWS Glue, puede usar un formulario en la consola de Athena, usar el editor de consultas de Athena o crear un rastreador de AWS Glue en la consola de AWS Glue. Los rastreadores de AWS Glue infieren automáticamente el esquema de tablas y bases de datos des los datos que tiene en Amazon S3. El uso de un formulario ofrece una mayor personalización. Redactar sus propias instrucciones de CREATE TABLE
requiere más esfuerzo, pero ofrece más control. Para obtener más información, consulte CREATE TABLE.
Recursos adicionales
-
Para obtener más información sobre AWS Glue Data Catalog, consulte Catálogo de datos y rastreadores en AWS Glue en la Guía para desarrolladores de AWS Glue.
-
Para ver un artículo ilustrativo que muestra cómo utilizar y Athena para procesar datos XML, consulte Procesar y analizar archivos XML altamente anidados y de gran tamaño mediante AWS Glue y Amazon Athena
en el Blog de Big Data de AWS. -
AWS Glue está sujeto a cargos por separado. Para más información, consulte Precios de AWS Glue
.
Temas
- Utilice un formulario de la consola de Athena para agregar una tabla de AWS Glue
- Utilice un rastreador para agregar una tabla
- Usar la AWS CLI para recrear una base de datos de AWS Glue y sus tablas
- Optimización de las consultas con indexación y filtrado de particiones de AWS Glue
- Registrar un catálogo de datos desde otra cuenta
- Trabajar con datos CSV en AWS Glue
- Uso de datos geoespaciales en AWS Glue
- Creación de tablas para los trabajos de ETL