Eliminación de archivos huérfanos - AWS Glue

Eliminación de archivos huérfanos

AWS Glue Data Catalog le permite eliminar archivos huérfanos de sus tablas de Iceberg. Los archivos huérfanos son archivos de datos o metadatos que ya no supervisan los metadatos de la tabla de Iceberg, pero que siguen existiendo en el origen de datos de Amazon S3. Con el tiempo, estos archivos huérfanos pueden acumularse debido a operaciones como la compactación, la eliminación de particiones o la reescritura de tablas, y ocupan espacio de almacenamiento innecesario.

El optimizador de eliminación de archivos huérfanos de AWS Glue analiza los metadatos de la tabla y los archivos de datos reales, identifica los archivos huérfanos y los elimina para recuperar espacio de almacenamiento.

Para iniciar la eliminación de archivos huérfanos, cree un optimizador de tablas de eliminación de archivos huérfanos en el Catálogo de datos.