Creación de un catálogo de Amazon S3 Tables en el AWS Glue Data Catalog - AWS Lake Formation

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Creación de un catálogo de Amazon S3 Tables en el AWS Glue Data Catalog

Las tablas Amazon S3 proporcionan almacenamiento S3 optimizado específicamente para las cargas de trabajo de análisis, lo que mejora el rendimiento de las consultas y reduce los costes. Los datos de Tablas de S3 se almacenan en un nuevo tipo de bucket: un bucket de tablas, que almacena tablas como subrecursos. Las tablas S3 incluyen compatibilidad integrada con el estándar Apache Iceberg, que le permite consultar fácilmente datos tabulares en cubos de tablas de Amazon S3 mediante motores de consulta populares como Apache Spark.

Puede integrar los cubos y tablas de Amazon S3 con AWS Glue Data Catalog (Data Catalog) y registrar el catálogo como una ubicación de datos de Lake Formation desde la consola de Lake Formation o mediante el servicio APIs. Cuando su organización administra los datos del catálogo de datos y registra la ubicación de los datos en Lake Formation, puede usar Lake Formation para controlar el acceso a sus conjuntos de datos.

Puede aplicar los permisos de Lake Formation mediante el control de acceso basado en etiquetas y el método de recurso con nombre en las bases de datos federadas, y compartirlos entre varias Cuentas de AWS AWS organizaciones y unidades organizativas ()OUs. También puede compartir las bases de datos federadas directamente con los directores de IAM desde otra cuenta.

Para obtener más información, consulte Uso de tablas de Amazon S3 con servicios de AWS análisis en la Guía del usuario de Amazon Simple Storage Service.

Cómo funciona la integración de Data Catalog y Lake Formation

Al integrar el catálogo de tablas de S3 con Data Catalog y Lake Formation, el AWS Glue servicio crea un único catálogo federado denominado s3tablescatalog Catálogo de datos predeterminado de su cuenta específico para usted. Región de AWS La integración mapea todos los recursos del bucket de tablas de Amazon S3 de su Región de AWS cuenta y del catálogo federado de la siguiente manera:

  • Los cubos de tablas de Amazon S3 se convierten en un catálogo de varios niveles en el catálogo de datos.

  • El espacio de nombres Amazon S3 asociado está registrado como base de datos en el catálogo de datos.

  • Las tablas de Amazon S3 del grupo de tablas se convierten en tablas del catálogo de datos.

Mapeo de objetos entre tablas S3 y AWS Glue Data Catalog.

Tras la integración con Lake Formation, puede crear tablas de Apache Iceberg en el catálogo de cubos de tablas y acceder a ellas mediante motores de AWS análisis integrados, como Amazon Athena Amazon EMR, así como motores de análisis de terceros.