Athena puede leer y escribir datos almacenados en clústeres de Redshift o espacios de nombres sin servidor que se hayan registrado en el AWS Glue Data Catalog. Esto funciona en tándem con AWS Lake Formation, que proporciona seguridad y gobernanza centralizadas, lo que garantiza que el acceso a los datos se administra de forma coherente en los distintos motores de consulta y mantiene controles de acceso detallados para los datos compartidos de Redshift.
Consideraciones y limitaciones
-
Vistas materializadas: las vistas materializadas de Amazon Redshift se pueden consultar desde Athena, pero no es posible crear vistas materializadas con Athena o Spark.
-
No se admiten las operaciones DDL, incluido el ajuste de la configuración de AWS Glue Data Catalog y las operaciones en tablas de almacenamiento administrado de Amazon Redshift.
Requisitos previos
Antes de poder consultar un catálogo de datos de AWS Glue desde Athena, complete las siguientes tareas:
-
Cree y registre un clúster de Amazon Redshift o un espacio de nombres sin servidor en el AWS Glue Data Catalog. Para obtener más información, consulte Cómo registrar un clúster en el AWS Glue Data Catalog o Cómo registrar espacios de nombres en el AWS Glue Data Catalog en la guía de administración de Amazon Redshift.
-
Cree un catálogo de datos en AWS Lake Formation a partir del espacio de nombres registrado. Para obtener más información, consulte Creación de catálogos federados de Amazon Redshift en la Guía para desarrolladores de AWS Lake Formation.
-
(Opcional) Utilice Lake Formation para establecer controles de acceso detallados en el catálogo. Para obtener más información, consulte Cómo incluir los datos en el AWS Glue Data Catalog en la Guía para desarrolladores de AWS Lake Formation.
Registrar un catálogo de datos de Redshift en la consola Athena
Para registrar un catálogo de datos Redshift en la consola de Athena, siga estos pasos.
-
Abra la consola de Athena en https://console.aws.amazon.com/athena/
. -
En el panel de navegación, elija Orígenes de datos y catálogos.
-
En la página Orígenes de datos y catálogos, elija Crear origen de datos.
-
En Elegir un origen de datos, elija Amazon S3: AWS Glue Data Catalog.
-
En la sección AWS Glue Data Catalog, bajo Cuenta de origen de datos, elija AWS Glue Data Catalog en esta cuenta.
-
En Crear una tabla o registrar un catálogo, elija Registrar un nuevo catálogo de AWS Glue.
-
En la sección Detalles del origen de datos, en Nombre del origen de datos, ingrese el nombre que desea utilizar para especificar el origen de datos en las consultas SQL o utilice el nombre predeterminado que se genera.
-
En Catálogo, seleccione Examinar para buscar una lista de catálogos de AWS Glue en la misma cuenta. Si no ve ningún catálogo existente, cree uno en la consola de AWS Glue
. -
En el cuadro de diálogo Examinar catálogos de AWS Glue, seleccione el catálogo que desea utilizar y, a continuación, elija Seleccionar.
-
(Opcional) En Etiquetas, ingrese cualquier par de clave/valor que desee asociar al origen de datos.
-
Elija Siguiente.
-
En la página Revisar y crear, compruebe que la información introducida es correcta y, a continuación, seleccione Crear origen de datos.