Visualizar estatísticas de colunas
Depois de gerar as estatísticas com sucesso, o Data Catalog armazena essas informações para que os otimizadores baseados em custos do Amazon Amazon Athena Redshift façam as melhores escolhas ao executar consultas. As estatísticas variam de acordo com o tipo de coluna.
- AWS Management Console
-
Para visualizar estatísticas de colunas para uma tabela
-
Após a execução da tarefa de estatísticas da coluna, a guia Estatísticas da coluna na página Detalhes da tabela mostra as estatísticas da tabela.
As seguintes estatísticas estão disponíveis:
Nome da coluna: o nome da coluna usada para gerar as estatísticas
Última atualização: a data e a hora em que as estatísticas foram geradas
Comprimento médio: o comprimento médio dos valores na coluna
Valores distintos: o número total de valores distintos na coluna. Estimamos o número de valores distintos em uma coluna com erro relativo de 5%.
Valor máximo: o maior valor na coluna.
Valor mínimo: o menor valor na coluna.
Comprimento máximo: o comprimento do valor mais alto na coluna.
Valores nulos: o número de valores nulos na coluna.
Valores verdadeiros: o número de valores verdadeiros na coluna.
Valores falsos: o número de valores falsos na coluna.
-
numFiles: o número total de arquivos na tabela. Esse valor está disponível na guia Propriedades avançadas.
-
- AWS CLI
-
O exemplo a seguir mostra como recuperar estatísticas de colunas usando a AWS CLI.
aws glue get-column-statistics-for-table \ --database-name
database_name
\ --table-nametable_name
\ --column-names<column_name>
Você também pode visualizar as estatísticas da coluna usando a GetColumnStatisticsForTableAPIoperação.