Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
Creación de tablas de Apache Iceberg
AWS Lake Formation admite la creación de tablas Apache Iceberg que utilizan el formato de datos Apache Parquet AWS Glue Data Catalog con datos que residen en Amazon S3. Una tabla en el Catálogo de datos es la definición de metadatos que representa los datos en un almacén de datos. De forma predeterminada, Lake Formation crea tablas Iceberg v2. Para ver la diferencia entre las tablas v1 y v2, consulte Cambios de versión de formato
Apache Iceberg
Puede utilizar la consola Lake Formation o la CreateTable
operación de AWS Glue API para crear una tabla de iceberg en el catálogo de datos. Para obtener más información, consulte CreateTable action (Python: create_table).
Cuando cree una tabla de Iceberg en el Catálogo de datos, deberá especificar el formato de la tabla y la ruta del archivo de metadatos en Amazon S3 para poder hacer lecturas y escrituras.
Puede usar Lake Formation para proteger su mesa de iceberg mediante permisos de control de acceso detallados al registrar la ubicación de datos de Amazon S3. AWS Lake Formation En el caso de los datos fuente de Amazon S3 y los metadatos que no estén registrados en Lake Formation, el acceso viene determinado por las políticas de IAM permisos y las AWS Glue acciones de Amazon S3. Para obtener más información, consulte Administrar los permisos de Lake Formation.
nota
El Catálogo de datos no admite la creación de particiones ni la adición de propiedades de tablas de iceberg.
Requisitos previos
Para crear tablas de Iceberg en el Catálogo de datos y configurar los permisos de acceso a los datos de Lake Formation, debe cumplir los siguientes requisitos:
-
Se requieren permisos para crear tablas de Iceberg sin datos registrados en Lake Formation.
Además de los permisos necesarios para crear una tabla en el Catálogo de datos, el creador de la tabla requiere los siguientes permisos:
s3:PutObject
en el recurso arn:aws:s3::: {} bucketName-
s3:GetObject
en el recurso arn:aws:s3::: {} bucketName -
s3:DeleteObject
en el recurso arn:aws:s3::: {} bucketName
-
Se requieren permisos para crear tablas de Iceberg con datos registrados en Lake Formation:
Para utilizar Lake Formation para administrar y asegurar los datos de su lago de datos, registre su ubicación de Amazon S3 que tiene los datos de las tablas con Lake Formation. Esto es para que Lake Formation pueda vender credenciales a servicios AWS analíticos como Athena, Redshift Spectrum y Amazon EMR para acceder a los datos. Para obtener más información sobre el registro de una ubicación de Amazon S3, consulte Añadir una ubicación de Amazon S3 a su lago de datos.
Una entidad principal que lee y escribe los datos subyacentes que están registrados en Lake Formation requiere los siguientes permisos:
-
lakeformation:GetDataAccess
-
DATA_LOCATION_ACCESS
Una entidad principal que tiene permisos de localización de datos en una localización también tiene permisos de localización en todas las ubicaciones secundarias.
Para obtener más información sobre permisos de ubicación de datos, consulte Control de acceso a los datos subyacentes.
-
Para permitir la compactación, el servicio debe asumir una IAM función que tenga permisos para actualizar las tablas del catálogo de datos. Para obtener más información, consulte los requisitos previos de optimización de tablas.
Creación de tablas de Iceberg
Puede crear tablas Iceberg v1 y v2 con la consola Lake Formation o AWS Command Line Interface tal como se documenta en esta página. También puede crear tablas Iceberg utilizando la AWS Glue consola o. Rastreador de AWS Glue Para más información, consulte Catálogo de datos y rastreadores en la Guía para desarrolladores de AWS Glue .
Creación de una tabla de Iceberg