VACUUM - Amazon Athena

VACUUM

La instrucción VACUUM realiza el mantenimiento de las tablas de Apache Iceberg al eliminar los archivos de datos que ya no se necesitan.

nota

VACUUM es transaccional y solo es compatible con las tablas de Apache Iceberg en la versión 3 del motor Athena.

Sinopsis

Para eliminar los archivos de datos que ya no se necesitan para una tabla Iceberg, use la siguiente sintaxis.

VACUUM target_table

Se recomienda ejecutar la instrucción VACUUM en las tablas Iceberg para eliminar los archivos de datos que ya no sean relevantes y reducir el tamaño de los metadatos y el consumo de almacenamiento.

aviso

Si ejecuta una operación de vencimiento de instantáneas, ya no podrá viajar en el tiempo a instantáneas vencidas.

VACUUM lleva a cabo las siguientes operaciones:

  • Elimina las instantáneas que tengan una antigüedad superior a la cantidad de tiempo especificada en la propiedad de la tabla vacuum_max_snapshot_age_seconds. De forma predeterminada, esta propiedad se establece en 432 000 segundos (5 días).

  • Elimina las instantáneas que no estén dentro del periodo de conservación y que superen el número especificado en la propiedad de la tabla vacuum_min_snapshots_to_keep. El valor predeterminado es 1.

    Puede especificar estas propiedades de la tabla en su instrucción CREATE TABLE. Después de crear la tabla, se puede usar la instrucción ALTER TABLE SET PROPERTIES para actualizarla.

  • Elimina los metadatos y los archivos de datos a los que no se pueda acceder como resultado de la eliminación de la instantánea.

  • Elimina los archivos huérfanos que tienen una antigüedad superior al tiempo especificado en la propiedad de la tabla vacuum_max_snapshot_age_seconds. Los archivos huérfanos son archivos del directorio de datos de la tabla que no forman parte del estado de la tabla.

Para obtener más información acerca de la creación y administración de tablas de Apache Iceberg en Athena, consulte Creación de tablas Iceberg y Administración de tablas Iceberg.