Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
Optimización de las tablas de Iceberg
Lake Formation admite múltiples opciones de optimización de tablas para mejorar la administración y el rendimiento de las tablas Apache Iceberg utilizadas por los motores y trabajos AWS analíticos. ETL Estos optimizadores proporcionan un uso eficiente del almacenamiento, un mejor rendimiento de las consultas y una administración de datos eficaz. Hay tres tipos de optimizadores de tablas disponibles en Lake Formation:
Compactación: la compactación de datos compacta archivos de datos pequeños para reducir el uso de almacenamiento y mejorar el rendimiento de lectura. Los archivos de datos se combinan y se reescriben para eliminar los datos obsoletos y consolidar los datos fragmentados en archivos más grandes y eficientes. La compactación se puede configurar para que se ejecute de forma automática o manual según sea necesario.
Retención de instantáneas: las instantáneas son versiones con fecha y hora de una tabla Iceberg. Las configuraciones de retención de instantáneas permiten a los clientes determinar cuánto tiempo se deben retener las instantáneas y cuántas instantáneas retener. La configuración de un optimizador de retención de instantáneas puede ayudar a gestionar la sobrecarga de almacenamiento al eliminar las instantáneas antiguas e innecesarias y sus archivos subyacentes asociados.
Eliminación de archivos huérfanos: los archivos huérfanos son archivos a los que los metadatos de la tabla de Iceberg ya no hacen referencia. Estos archivos pueden acumularse con el tiempo, especialmente después de operaciones como la eliminación de tablas o los trabajos fallidos. ETL Habilitar la eliminación de archivos huérfanos AWS Glue permite identificar y eliminar periódicamente estos archivos innecesarios, liberando espacio de almacenamiento.
Puede activar o desactivar los optimizadores de compactación, retención de instantáneas y eliminación de archivos huérfanos para tablas Iceberg individuales del catálogo de datos mediante la consola o mediante operaciones. AWS Glue AWS CLI AWS Glue API
Para obtener más información, consulte Optimización de las tablas Iceberg en la Guía para desarrolladores. AWS Glue