As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.
Visualizar estatísticas de colunas
Depois de gerar as estatísticas com êxito, o Data Catalog armazena essas informações para que os otimizadores baseados em custos no Amazon Athena e no Amazon Redshift façam as melhores escolhas ao executar consultas. As estatísticas variam de acordo com o tipo de coluna.
- AWS Management Console
-
Para visualizar estatísticas de colunas para uma tabela
-
Após a execução da tarefa de estatísticas da coluna, a guia Estatísticas da coluna na página Detalhes da tabela mostra as estatísticas da tabela.
As seguintes estatísticas estão disponíveis:
Nome da coluna: o nome da coluna usada para gerar as estatísticas
Última atualização: a data e a hora em que as estatísticas foram geradas
Comprimento médio: o comprimento médio dos valores na coluna
Valores distintos: o número total de valores distintos na coluna. Estimamos o número de valores distintos em uma coluna com erro relativo de 5%.
Valor máximo: o maior valor na coluna.
Valor mínimo: o menor valor na coluna.
Comprimento máximo: o comprimento do valor mais alto na coluna.
Valores nulos: o número de valores nulos na coluna.
Valores verdadeiros: o número de valores verdadeiros na coluna.
Valores falsos: o número de valores falsos na coluna.
- AWS CLI
-
O exemplo a seguir mostra como recuperar estatísticas de colunas usando a AWS CLI.
aws glue get-column-statistics-for-table \
--database-name <test_db>
\
--table-name <test_tble>
\
--column-names <col1>
Você também pode visualizar as estatísticas da coluna usando a operação da API GetColumnStatisticsForTable.