Seleccione sus preferencias de cookies

Usamos cookies esenciales y herramientas similares que son necesarias para proporcionar nuestro sitio y nuestros servicios. Usamos cookies de rendimiento para recopilar estadísticas anónimas para que podamos entender cómo los clientes usan nuestro sitio y hacer mejoras. Las cookies esenciales no se pueden desactivar, pero puede hacer clic en “Personalizar” o “Rechazar” para rechazar las cookies de rendimiento.

Si está de acuerdo, AWS y los terceros aprobados también utilizarán cookies para proporcionar características útiles del sitio, recordar sus preferencias y mostrar contenido relevante, incluida publicidad relevante. Para aceptar o rechazar todas las cookies no esenciales, haga clic en “Aceptar” o “Rechazar”. Para elegir opciones más detalladas, haga clic en “Personalizar”.

Habilitación de la generación automática de estadísticas a nivel de catálogo

Modo de enfoque
Habilitación de la generación automática de estadísticas a nivel de catálogo - AWS Glue

Puede habilitar la generación automática de estadísticas de columnas en todas las tablas nuevas de Apache Iceberg y las tablas que tengan formatos que no sean OTF (Parquet, JSON, CSV, XML, ORC, ION) del catálogo de datos. Tras crear la tabla, también puede actualizar de forma explícita y manual la configuración de las estadísticas de columnas.

Para actualizar la configuración del catálogo de datos y así poder habilitar el nivel de catálogo, el rol de IAM que utilice debe tener el permiso glue:UpdateCatalog o el permiso AWS Lake Formation ALTER CATALOG del catálogo raíz. Puede utilizar la API GetCatalog para verificar las propiedades del catálogo.

AWS Management Console
Habilitación de la generación automática de estadísticas de columnas a nivel de cuenta
  1. Abra la consola de Lake Formation en https://console.aws.amazon.com/lakeformation/.

  2. En la barra de navegación izquierda, elija Claves.

  3. En la página Resumen del catálogo, seleccione Editar en Configuración de la optimización.

    La captura de pantalla muestra las opciones disponibles para generar estadísticas de columnas.
  4. En la página Configuración de la optimización de tablas, elija la opción Habilitar la generación automática de estadísticas para las tablas del catálogo.

    La captura de pantalla muestra las opciones disponibles para generar estadísticas de columnas.
  5. Elija un rol de IAM existente o cree uno nuevo con los permisos necesarios para ejecutar la tarea de estadísticas de columnas.

  6. Seleccione Enviar.

AWS CLI

También puede habilitar la recopilación de estadísticas a nivel de catálogo a través de AWS CLI. Para configurar la recopilación de estadísticas a nivel de tabla mediante AWS CLI, ejecute el siguiente comando:

aws glue update-catalog --cli-input-json '{
    "name": "123456789012",
    "catalogInput": {
        "description": "Updating root catalog with role arn",
        "catalogProperties": {
            "customProperties": {
                "ColumnStatistics.RoleArn": "arn:aws:iam::"123456789012":role/service-role/AWSGlueServiceRole",
                "ColumnStatistics.Enabled": "true"
            }
        }
    }
}'
                   

El comando anterior llama a operación UpdateCatalog de AWS Glue, que adopta una estructura CatalogProperties con los siguientes pares clave-valor para generar estadísticas a nivel de catálogo:

  • ColumnStatistics.RoleArn: ARN del rol de IAM se utilizará en todas las tareas activadas para la generación de estadísticas a nivel de catálogo

  • ColumnStatistics.Enabled: valor booleano que indica si la configuración a nivel de catálogo está habilitada o deshabilitada

Habilitación de la generación automática de estadísticas de columnas a nivel de cuenta
  1. Abra la consola de Lake Formation en https://console.aws.amazon.com/lakeformation/.

  2. En la barra de navegación izquierda, elija Claves.

  3. En la página Resumen del catálogo, seleccione Editar en Configuración de la optimización.

    La captura de pantalla muestra las opciones disponibles para generar estadísticas de columnas.
  4. En la página Configuración de la optimización de tablas, elija la opción Habilitar la generación automática de estadísticas para las tablas del catálogo.

    La captura de pantalla muestra las opciones disponibles para generar estadísticas de columnas.
  5. Elija un rol de IAM existente o cree uno nuevo con los permisos necesarios para ejecutar la tarea de estadísticas de columnas.

  6. Seleccione Enviar.

PrivacidadTérminos del sitioPreferencias de cookies
© 2025, Amazon Web Services, Inc o sus afiliados. Todos los derechos reservados.