Acceso a las tablas entre regiones - AWS Lake Formation

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Acceso a las tablas entre regiones

Lake Formation permite consultar las tablas del catálogo de datos en todas las AWS regiones. Puede acceder a los datos de una región desde otras regiones mediante Amazon Athena, Amazon EMR y AWS Glue ETL creando enlaces de recursos en otras regiones que apunten a las bases de datos y tablas de origen. Con el acceso a las tablas entre regiones, puede acceder a los datos de todas las regiones sin copiar los datos subyacentes o los metadatos en el Catálogo de datos.

Por ejemplo, puede compartir una base de datos o una tabla de una cuenta de productor con una cuenta de consumidor en la Región A. Tras aceptar la invitación a compartir recursos en la Región A, el administrador del lago de datos de la cuenta de consumidor puede crear enlaces de recursos al recurso compartido en la Región B. El administrador de la cuenta de consumidor puede conceder permisos sobre el recurso compartido a las entidades principales de IAM de esa cuenta en la Región A y conceder permisos de enlace de recursos en la Región B. Con el enlace de recursos, las entidades principales de la cuenta de consumidor pueden consultar los datos compartidos de la Región B.

También puede alojar el origen de datos de Amazon S3 de la región A en una cuenta de productor y registrar la ubicación de los datos en una cuenta central de la región B. Puede crear recursos del Catálogo de datos en la cuenta central, configurar los permisos de Lake Formation y compartir datos con los consumidores de su cuenta o con cuentas externas de la región B. La característica entre regiones permite a los usuarios acceder a estas tablas del Catálogo de datos desde la región C mediante enlaces de recursos.

Con esta característica, puede consultar bases de datos federadas en Apache Hive Metastores entre regiones y también unir tablas de la región local con tablas de otra región al ejecutar consultas.

Lake Formation admite las siguientes características con acceso a tablas entre regiones:

  • Control de acceso basado en etiquetas LF

  • Permisos de control de acceso específicos

  • Escribir operaciones en la base de datos o tabla compartida con los permisos adecuados

  • Intercambio de datos entre cuentas en el nivel de cuentas y directamente con el nivel de entidades principales de IAM

Los usuarios no administrativos con permisos Create_Database y Create_Table pueden crear enlaces de recursos entre regiones.

nota

Puede crear enlaces de recursos entre regiones en cualquier región y acceder a los datos sin aplicar los permisos de Lake Formation. En el caso de los datos fuente de Amazon S3 que no estén registrados en Lake Formation, el acceso viene determinado por las políticas de permisos y AWS Glue acciones de IAM para Amazon S3.

Para conocer las limitaciones, consulte Limitaciones de acceso a datos entre regiones.

Flujos de trabajo

Los siguientes diagramas muestran los flujos de trabajo para acceder a los datos de todas AWS las regiones desde la misma AWS cuenta y desde una cuenta externa.

Flujo de trabajo para acceder a las tablas compartidas en la misma AWS cuenta

En el siguiente diagrama, los datos se comparten con un usuario de la misma AWS cuenta en la región EE.UU. Este (Virginia del Norte) y el usuario consulta los datos compartidos desde la región Europa (Irlanda).

El administrador del lago de datos efectúa las actividades siguientes (pasos 1 y 2):

  1. Un administrador de data lake configura una AWS cuenta en las bases de datos y tablas del catálogo de datos y registra una ubicación de datos de Amazon S3 en Lake Formation en la región EE.UU. Este (Norte de Virginia).

    Otorga permiso de Select sobre un recurso del Catálogo de datos (tabla de productos en el diagrama) a una entidad principal (usuario) de la misma cuenta.

  2. Crea un enlace de recursos en la región Europa (Irlanda) que apunta a la tabla de origen en la región Este de EE. UU. (Norte de Virginia). Otorga permiso de DESCRIBE a la entidad principal para utilizar el enlace de recursos de la región de Europa (Irlanda).

  3. El usuario consulta la tabla desde la región Europa (Irlanda) mediante Athena.

Flujo de trabajo para acceder a las tablas compartidas con una AWS cuenta externa

En el siguiente diagrama, la cuenta del productor (cuenta A) aloja el bucket de Amazon S3, registra la ubicación de los datos y comparte una tabla del Catálogo de datos con una cuenta de consumidor (cuenta B) de la región Este de EE. UU. (Norte de Virginia) y un usuario de la cuenta de consumidor (cuenta B) consulta la tabla de la región de Europa (Irlanda).

  1. Un administrador de data lake configura una AWS cuenta (cuenta de productor) con los recursos del catálogo de datos y una ubicación de datos de Amazon S3 registrada en Lake Formation en la región EE.UU. Este (Norte de Virginia).

  2. El administrador del lago de datos de la cuenta del productor comparte una tabla del Catálogo de datos con una cuenta de consumidor.

  3. El administrador del lago de datos de la cuenta de consumidor acepta la invitación a compartir datos en la región de Este de EE. UU. (Norte de Virginia) y concede el permiso de Select para utilizar la tabla compartida con una entidad principal de la misma región.

  4. El administrador del lago de datos de la cuenta de consumidor crea un enlace de recursos en la región de Europa (Irlanda) que apunta a la tabla compartida de destino en la región Este de EE. UU. (Norte de Virginia) y concede al usuario permiso de DESCRIBE para acceder al enlace de recursos desde la región de Europa (Irlanda).

  5. El usuario consulta la tabla desde la región Europa (Irlanda) mediante Athena.