Para generar y almacenar Metadatos de Amazon S3 en una tabla de metadatos de Apache Iceberg totalmente administrada, debe crear una configuración de tabla de metadatos para el bucket de uso general. Amazon S3 se ha diseñado para actualizar continuamente la tabla de metadatos y reflejar los últimos cambios en los datos, siempre y cuando la configuración esté activa en el bucket. Además, Amazon S3 optimiza continuamente la tabla de metadatos para ayudar a reducir los costos de almacenamiento y mejorar el rendimiento de las consultas de análisis.
Las tablas de metadatos tienen el siguiente formato de nombre de recurso de Amazon (ARN):
arn:aws:s3tables:
region-code
:account-id
:bucket/table-bucket-name
/table/metadata_table_name
Las tablas de metadatos totalmente administradas de Amazon S3 se almacenan en el espacio de nombres aws_s3_metadata
del bucket de tablas. Para obtener más información sobre los espacios de nombres en los buckets de tablas, consulte Espacios de nombres de tablas.
Puede crear una configuración de tabla de metadatos mediante la consola de Amazon S3, la AWS Command Line Interface (AWS CLI), los SDK de AWS o la API de REST de Amazon S3.
Requisitos previos
Para crear una configuración de tabla de metadatos, primero debe hacer lo siguiente:
-
Asegúrese de que tiene los permisos de AWS Identity and Access Management (IAM) necesarios para crear y administrar tablas de metadatos. Para obtener más información, consulte Configuración de permisos para configurar tablas de metadatos.
-
Cree un bucket de tablas de S3 para almacenar la tabla de metadatos. Este bucket de tablas debe estar en la misma Región de AWS y Cuenta de AWS que el bucket de uso general. Para obtener más información sobre cómo crear buckets de tablas, consulte Creación de buckets de tablas. Si utiliza la consola de Amazon S3 para crear la configuración, puede realizar este paso como parte de ese proceso.
-
Integre el bucket de tablas con AWS Glue Data Catalog para poder consultar directamente las tablas de metadatos con motores de consulta como Amazon Athena, Amazon EMR, Amazon Redshift, Apache Spark, Apache Trino y cualquier otra aplicación que admita el formato Apache Iceberg. Para obtener más información, consulte Consulta de tablas de metadatos con servicios de análisis de AWS.
Creación de una configuración de tabla de metadatos
Creación de una configuración de tabla de metadatos
Antes de crear una configuración de tabla de metadatos, asegúrese de que ha revisado y cumplido los requisitos previos y que ha revisado Restricciones y limitaciones de las tablas de metadatos.
Inicie sesión AWS Management Console Management Console y abra la consola de Amazon S3 en https://console.aws.amazon.com/s3/
. -
En el panel de navegación izquierdo, elija Buckets de uso general.
-
Elija el bucket de uso general para el que desea crear una configuración de tabla de metadatos.
nota
Asegúrese de que este bucket de uso general es una Región de AWS donde hay buckets de tablas disponibles. Los buckets de tablas solo están disponibles en las regiones Este de EE. UU. (Norte de Virginia), Este de EE. UU. (Ohio) y Oeste de EE. UU. (Oregón).
-
En la página de detalles de los buckets, elija la pestaña Metadatos.
-
En la pestaña Metadatos, elija Crear configuración de metadatos.
-
En la página Crear configuración de metadatos, en Bucket de tablas de destino, especifique un bucket de tablas para almacenar la tabla de metadatos. El bucket de tablas debe estar en la misma Cuenta de AWS y Región de AWS que el bucket de uso general.
Si aún no tiene un bucket de tablas, elija Crear bucket de tablas. Los nombres de bucket de tablas deben tener entre 3 y 63 caracteres y ser únicos dentro de la Cuenta de AWS en la Región de AWS que haya elegido. Caracteres válidos: a-z, 0-9 y guiones (-). Para obtener más información acerca de la creación de un bucket de tablas, consulte Creación de buckets de tablas.
Cuando cree el bucket de tablas, asegúrese de integrarlo con AWS Glue Data Catalog. Para obtener más información, consulte Consulta de tablas de metadatos con servicios de análisis de AWS.
-
En Nombre de tabla de metadatos, especifique el nombre que desea que tenga la tabla. El nombre de tabla de metadatos debe tener entre 1 y 255 caracteres y ser único en el espacio de nombres
aws_s3_metadata
del bucket de tablas. Los caracteres válidos son letras minúsculas, números y guiones bajos (_
). -
Elija Crear configuración de tabla de metadatos.
Si la configuración de tabla de metadatos se ha realizado correctamente, el ARN de la tabla de metadatos se muestra en la pestaña Metadatos, junto con el bucket de tablas especificado y el nombre de tabla de metadatos.
Para supervisar las actualizaciones de la configuración de la tabla de metadatos, puede utilizar AWS CloudTrail. Para obtener más información, consulte Acciones de bucket de Amazon S3 de las que realiza un seguimiento el registro de CloudTrail.
Para ejecutar los siguientes comandos, debe tener instalado y configurado la AWS CLI. Si aún no ha instalado la AWS CLI, consulte Instalación o actualización de la última versión de la AWS CLI en la Guía del usuario de la AWS Command Line Interface.
De forma alternativa, puede ejecutar comandos de la AWS CLI desde la consola mediante AWS CloudShell. AWS CloudShell es un intérprete de comandos previamente autenticado y basado en el navegador que se puede lanzar directamente desde la AWS Management Console. Para obtener más información, consulte ¿Qué es CloudShell? e Introducción a AWS CloudShell en la Guía el usuario de AWS CloudShell.
Creación de una configuración de tabla de metadatos mediante la AWS CLI
Antes de crear una configuración de tabla de metadatos, asegúrese de que ha revisado y cumplido los requisitos previos y que ha revisado Restricciones y limitaciones de las tablas de metadatos.
Para utilizar los comandos de ejemplo siguientes, sustituya
con su información. user input
placeholders
-
Si aún no tiene un bucket de tablas, utilice el siguiente comando para crear uno en el que almacenar la tabla de metadatos. Asegúrese de que el bucket de tablas esté en la misma Región de AWS que el bucket de uso general para el que desea crear una configuración de tabla de metadatos.
aws s3tables create-table-bucket --name
amzn-s3-demo-bucket
--regionus-east-2
-
Para verificar que se ha creado el bucket de tablas, utilice el siguiente comando:
aws s3tables list-table-buckets --region
us-east-2
-
Cree un archivo JSON que contenga la configuración de tabla de metadatos y guárdelo (por ejemplo,
metadata-config.json
). A continuación se muestra un ejemplo de configuración.Los nombres de bucket de tablas deben tener entre 3 y 63 caracteres y ser únicos dentro de la Cuenta de AWS en la Región de AWS que haya elegido. Caracteres válidos: a-z, 0-9 y guiones (-). Para obtener más información acerca de la creación de un bucket de tablas, consulte Creación de buckets de tablas.
El nombre de tabla de metadatos debe tener entre 1 y 255 caracteres y ser único en el espacio de nombres
aws_s3_metadata
del bucket de tablas. Los caracteres válidos son letras minúsculas, números y guiones bajos (_
).{ "S3TablesDestination": { "TableBucketArn": "arn:aws:s3tables:
us-east-2
:111122223333
:bucket/amzn-s3-demo-bucket
", "TableName": "test_metadata_table
" } } -
Utilice el siguiente comando para aplicar la configuración de tabla de metadatos al bucket de uso general (por ejemplo,
):amzn-s3-demo-source-bucket
aws s3api create-bucket-metadata-table-configuration \ --bucket
\ --metadata-table-configuration file://./amzn-s3-demo-source-bucket
metadata-config
.json \ --regionus-east-2
-
Para verificar que se ha creado la configuración, utilice el siguiente comando:
aws s3api get-bucket-metadata-table-configuration \ --bucket
\ --regionamzn-s3-demo-source-bucket
us-east-2
Para supervisar las actualizaciones de la configuración de la tabla de metadatos, puede utilizar AWS CloudTrail. Para obtener más información, consulte Acciones de bucket de Amazon S3 de las que realiza un seguimiento el registro de CloudTrail.
Puede enviar solicitudes de REST para crear una configuración de tabla de metadatos. Para obtener más información, consulte CreateBucketMetadataTableConfiguration en la Referencia de la API de Amazon S3.
Puede utilizar los SDK de AWS para crear una configuración de tabla de metadatos en Amazon S3. Para obtener información, consulte la lista de SDK compatibles en la Referencia de la API de Amazon S3.