Consulta de tablas de metadatos
Las tablas de Metadatos de Amazon S3 se almacenan en un bucket de tablas de S3 administradas de AWS, que proporciona almacenamiento optimizado para datos tabulares. Para consultar los metadatos, puede integrar el bucket de tablas con Amazon SageMaker Lakehouse. Esta integración, que utiliza AWS Glue Data Catalog y AWS Lake Formation, permite a los servicios de análisis de AWS detectar automáticamente los datos de la tabla y acceder a ellos.
Una vez que el bucket de tablas esté integrado con AWS Glue Data Catalog, podrá consultar directamente las tablas de metadatos con servicios de análisis de AWS como Amazon Athena, Amazon EMR y Amazon Redshift. También puede crear paneles interactivos con los datos de consulta mediante Amazon QuickSight.
Para obtener más información sobre la integración del bucket de tablas de S3 administradas de AWS con Amazon SageMaker Lakehouse, consulte Uso de Tablas de Amazon S3 con servicios de análisis de AWS.
También puede consultar las tablas de metadatos con Apache Spark, Apache Trino y cualquier aplicación que admita el formato de Apache Iceberg mediante el punto de conexión REST de Iceberg de AWS Glue, el punto de conexión REST de Iceberg de Tablas de Amazon S3 o el catálogo de Tablas de Amazon S3 para el catálogo de clientes de Apache Iceberg. Para obtener más información sobre el acceso a las tablas de metadatos, consulte Acceso a los datos de tablas.
Puede analizar las tablas de metadatos con cualquier motor de consulta que admita el formato Apache Iceberg. Por ejemplo, puede consultar las tablas de metadatos para hacer lo siguiente:
-
Descubrir patrones y tendencias de uso de almacenamiento
-
Auditar el uso de claves de cifrado de AWS Key Management Service (AWS KMS) en los objetos
-
Buscar objetos por metadatos definidos por el usuario y etiquetas de objeto
-
Comprender los cambios de metadatos de objetos a lo largo del tiempo
-
Obtener información sobre cuándo se actualizan o eliminan los objetos, incluido el ID de Cuenta de AWS o la dirección IP que ha realizado la solicitud
También puede unir tablas de metadatos administradas por S3 y tablas de metadatos personalizadas, lo que le permite realizar consultas en varios conjuntos de datos.
Consideraciones sobre los precios de consulta
Se aplican precios adicionales por ejecutar consultas en las tablas de metadatos. Para obtener más información, consulte la información de precios del motor de consulta que está utilizando.
Para obtener información sobre cómo hacer que las consultas sean más rentables, consulte Optimización del rendimiento de las consultas de tablas de metadatos.