Visualización de estadísticas de columnas - AWS Glue

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Visualización de estadísticas de columnas

Tras generar las estadísticas correctamente, el catálogo de datos almacena esta información para que los optimizadores basados en los costos de Amazon Athena y Amazon Redshift puedan tomar las decisiones óptimas al ejecutar consultas. Las estadísticas varían en función del tipo de columna.

AWS Management Console
Para ver las estadísticas de columna de una tabla
  • Tras ejecutar la tarea de estadísticas de columnas, la pestaña Estadísticas de columnas de la página de Detalles de la tabla muestra las estadísticas de la tabla.

    La captura de pantalla muestra las columnas generadas a partir de la ejecución más reciente.

    Están disponibles las siguientes estadísticas:

    • Nombre de columna: nombre de columna utilizado para generar estadísticas

    • Última actualización: fecha y hora en que se generaron las estadísticas

    • Longitud media: longitud media de los valores de la columna

    • Valores distintos: número total de valores distintos de la columna. Estimamos el número de valores distintos de una columna con un error relativo del 5 %.

    • Valor máximo: el valor más alto de la columna.

    • Valor mínimo: el valor más bajo de la columna.

    • Longitud máxima: longitud del valor más alto de la columna.

    • Valores nulos: el número total de valores nulos en la columna.

    • Valores verdaderos: el número de valores verdaderos en la columna.

    • Valores falsos: el número de valores falsos en la columna.

    • numFiles: número total de archivos de la tabla. Este valor está disponible en la pestaña Propiedades avanzadas.

AWS CLI

En el siguiente ejemplo se muestra cómo recuperar estadísticas de columnas mediante AWS CLI.

aws glue get-column-statistics-for-table \ --database-name <test_db> \ --table-name <test_tble> \ --column-names <col1>

También puede ver las estadísticas de las columnas mediante la operación de API GetColumnStatisticsForTable.