Utilice AWS Glue Data Catalog para conectarse a los datos

Modo de enfoque

Utilice AWS Glue Data Catalog para conectarse a los datos - Amazon Athena

Athena utiliza AWS Glue Data Catalog para almacenar metadatos, como nombres de tablas y columnas para los datos almacenados en Amazon S3. Esta información de metadatos se convierte en las tablas de datos, las tablas y las vistas que aparecen en el editor de consultas de Athena.

Al utilizar Athena con el AWS Glue Data Catalog, puede usar AWS Glue para crear las bases de datos y las tablas (esquemas) que consultará en Athena, o bien puede utilizar Athena para crear un esquema y entonces utilizarlo en AWS Glue u otros servicios relacionados.

Para definir la información del esquema para AWS Glue, puede usar un formulario en la consola de Athena, usar el editor de consultas de Athena o crear un rastreador de AWS Glue en la consola de AWS Glue. Los rastreadores de AWS Glue infieren automáticamente el esquema de tablas y bases de datos des los datos que tiene en Amazon S3. El uso de un formulario ofrece una mayor personalización. Redactar sus propias instrucciones de CREATE TABLE requiere más esfuerzo, pero ofrece más control. Para obtener más información, consulte CREATE TABLE.

Recursos adicionales

Para obtener más información sobre AWS Glue Data Catalog, consulte Catálogo de datos y rastreadores en AWS Glue en la Guía para desarrolladores de AWS Glue.
Para ver un artículo ilustrativo que muestra cómo utilizar y Athena para procesar datos XML, consulte Procesar y analizar archivos XML altamente anidados y de gran tamaño mediante AWS Glue y Amazon Athena en el Blog de Big Data de AWS.
AWS Glue está sujeto a cargos por separado. Para más información, consulte Precios de AWS Glue.