Las siguientes consideraciones y limitaciones se aplican a la generación de estadísticas de columnas.
Consideraciones
El uso del muestreo para generar estadísticas reduce el tiempo de ejecución, pero puede generar estadísticas inexactas.
El catálogo de datos no almacena versiones diferentes de las estadísticas.
Solo puede ejecutar una tarea de generación de estadísticas a la vez por tabla.
Si una tabla se cifra con la AWS KMS clave del cliente registrada en Data Catalog, se AWS Glue utiliza la misma clave para cifrar las estadísticas.
La tarea de estadísticas de las columnas permite generar estadísticas:
Cuando el IAM rol tiene permisos de tabla completos (IAMo Lake Formation).
Cuando el IAM rol tiene permisos sobre la mesa mediante el modo de acceso híbrido de Lake Formation.
La tarea de estadísticas de columnas no admite la generación de estadísticas para:
Mesas con control de acceso basado en celdas de Lake Formation
Lagos de datos transaccionales: Fundación Linux Delta Lake, Apache Hudi
Tablas en bases de datos federadas: recursos compartidos de datos Hive metastore, Amazon Redshift
Columnas anidadas, matrices y tipos de datos de estructura.
Tabla que se comparte contigo desde otra cuenta