Integración con AWS Glue
AWS Glue es un Servicio de AWS de extracción, transformación y carga (ETL, extract, transform, and load) completamente administrado. Una de sus capacidades clave es analizar y categorizar datos. Puede utilizar los rastreadores de AWS Glue para inferir de forma automática el esquema de bases de datos y tablas de sus datos en Amazon S3 y almacenar los metadatos asociados en el AWS Glue Data Catalog.
Athena utiliza el AWS Glue Data Catalog para almacenar y recuperar metadatos de tabla para los datos de Amazon S3 en su cuenta de Amazon Web Services. Los metadatos de la tabla permiten al motor de consultas de Athena saber cómo buscar, leer y procesar los datos que desea consultar.
Para crear un esquema de bases de datos y tablas en el AWS Glue Data Catalog, puede ejecutar un rastreador de AWS Glue desde Athena en un origen de datos, o puede ejecutar consultas de lenguaje de definición de datos (DDL) directamente en el Editor de consultas de Athena. A continuación, mediante el esquema de bases de datos y tablas que creó, puede utilizar consultas de manipulación de datos (DML) en Athena para consultar los datos.
Ahora puede registrar el AWS Glue Data Catalog desde una cuenta que no sea la suya. Una vez configurados los permisos de IAM necesarios para AWS Glue, puede utilizar Athena para ejecutar consultas entre cuentas. Para obtener más información, consulte Acceso entre cuentas a los catálogos de datos de AWS Glue.
Para obtener más información sobre AWS Glue Data Catalog, consulte Catálogo de datos y rastreadores en AWS Glue en la Guía para desarrolladores de AWS Glue.
AWS Glue está sujeto a cargos por separado. Para obtener más información, consulte Precios de AWS Glue
Temas