VACUUM
La instrucción VACUUM
realiza el mantenimiento de las tablas de Apache Iceberg al eliminar los archivos de datos que ya no se necesitan.
VACUUM
es transaccional y solo es compatible con las tablas de Apache Iceberg en la versión 3 del motor Athena.
Sinopsis
Para eliminar los archivos de datos que ya no se necesitan para una tabla Iceberg, use la siguiente sintaxis.
VACUUM target_table
Se recomienda ejecutar la instrucción VACUUM
en las tablas Iceberg para eliminar los archivos de datos que ya no sean relevantes y reducir el tamaño de los metadatos y el consumo de almacenamiento.
Si ejecuta una operación de vencimiento de instantáneas, ya no podrá viajar en el tiempo a instantáneas vencidas.
VACUUM
lleva a cabo las siguientes operaciones:
-
Elimina las instantáneas que tengan una antigüedad superior a la cantidad de tiempo especificada en la propiedad de la tabla
vacuum_max_snapshot_age_seconds
. De forma predeterminada, esta propiedad se establece en 432 000 segundos (5 días). -
Elimina las instantáneas que no estén dentro del periodo de conservación y que superen el número especificado en la propiedad de la tabla
vacuum_min_snapshots_to_keep
. El valor predeterminado es 1.Puede especificar estas propiedades de la tabla en su instrucción
CREATE TABLE
. Después de crear la tabla, se puede usar la instrucción ALTER TABLE SET PROPERTIES para actualizarla. -
Elimina los metadatos y los archivos de datos a los que no se pueda acceder como resultado de la eliminación de la instantánea.
-
Elimina los archivos huérfanos que tienen una antigüedad superior al tiempo especificado en la propiedad de la tabla
vacuum_max_snapshot_age_seconds
. Los archivos huérfanos son archivos del directorio de datos de la tabla que no forman parte del estado de la tabla.
Para obtener más información acerca de la creación y administración de tablas de Apache Iceberg en Athena, consulte Creación de tablas Iceberg y Administración de tablas Iceberg.