Visualizar estatísticas de colunas - AWS Glue

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Visualizar estatísticas de colunas

Depois de gerar as estatísticas com êxito, o Data Catalog armazena essas informações para que os otimizadores baseados em custos no Amazon Athena e no Amazon Redshift façam as melhores escolhas ao executar consultas. As estatísticas variam de acordo com o tipo de coluna.

AWS Management Console
Para visualizar estatísticas de colunas para uma tabela
  • Após a execução da tarefa de estatísticas da coluna, a guia Estatísticas da coluna na página Detalhes da tabela mostra as estatísticas da tabela.

    A captura de tela mostra as colunas geradas com base na execução mais recente.

    As seguintes estatísticas estão disponíveis:

    • Nome da coluna: o nome da coluna usada para gerar as estatísticas

    • Última atualização: a data e a hora em que as estatísticas foram geradas

    • Comprimento médio: o comprimento médio dos valores na coluna

    • Valores distintos: o número total de valores distintos na coluna. Estimamos o número de valores distintos em uma coluna com erro relativo de 5%.

    • Valor máximo: o maior valor na coluna.

    • Valor mínimo: o menor valor na coluna.

    • Comprimento máximo: o comprimento do valor mais alto na coluna.

    • Valores nulos: o número de valores nulos na coluna.

    • Valores verdadeiros: o número de valores verdadeiros na coluna.

    • Valores falsos: o número de valores falsos na coluna.

AWS CLI

O exemplo a seguir mostra como recuperar estatísticas de colunas usando a AWS CLI.

aws glue get-column-statistics-for-table \ --database-name <test_db> \ --table-name <test_tble> \ --column-names <col1>

Você também pode visualizar as estatísticas da coluna usando a operação da API GetColumnStatisticsForTable.