Visualizar estatísticas de colunas - AWS Glue

Visualizar estatísticas de colunas

Depois de gerar as estatísticas com sucesso, o Data Catalog armazena essas informações para que os otimizadores baseados em custos do Amazon Amazon Athena Redshift façam as melhores escolhas ao executar consultas. As estatísticas variam de acordo com o tipo de coluna.

AWS Management Console
Para visualizar estatísticas de colunas para uma tabela
  • Após a execução da tarefa de estatísticas da coluna, a guia Estatísticas da coluna na página Detalhes da tabela mostra as estatísticas da tabela.

    A captura de tela mostra as colunas geradas com base na execução mais recente.

    As seguintes estatísticas estão disponíveis:

    • Nome da coluna: o nome da coluna usada para gerar as estatísticas

    • Última atualização: a data e a hora em que as estatísticas foram geradas

    • Comprimento médio: o comprimento médio dos valores na coluna

    • Valores distintos: o número total de valores distintos na coluna. Estimamos o número de valores distintos em uma coluna com erro relativo de 5%.

    • Valor máximo: o maior valor na coluna.

    • Valor mínimo: o menor valor na coluna.

    • Comprimento máximo: o comprimento do valor mais alto na coluna.

    • Valores nulos: o número de valores nulos na coluna.

    • Valores verdadeiros: o número de valores verdadeiros na coluna.

    • Valores falsos: o número de valores falsos na coluna.

    • numFiles: o número total de arquivos na tabela. Esse valor está disponível na guia Propriedades avançadas.

AWS CLI

O exemplo a seguir mostra como recuperar estatísticas de colunas usando a AWS CLI.

aws glue get-column-statistics-for-table \ --database-name database_name \ --table-name table_name \ --column-names <column_name>

Você também pode visualizar as estatísticas da coluna usando a GetColumnStatisticsForTableAPIoperação.