Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
Visualizzazione delle statistiche delle colonne
Dopo aver generato correttamente le statistiche, Data Catalog memorizza queste informazioni per gli ottimizzatori basati sui costi in Amazon Redshift Amazon Athena e in Amazon Redshift per effettuare scelte ottimali durante l'esecuzione delle query. Le statistiche variano in base al tipo di colonna.
- AWS Management Console
-
Per visualizzare le statistiche delle colonne per una tabella
-
Dopo l'esecuzione dell'attività di statistica delle colonne, la scheda Statistiche delle colonne della pagina dei Dettagli della tabella mostra le statistiche relative alla tabella.
Sono disponibili le seguenti statistiche:
Nome colonna: nome della colonna utilizzato per generare statistiche
Ultimo aggiornamento: data e ora in cui sono state generate le statistiche
Lunghezza media: lunghezza media dei valori nella colonna
Valori distinti: il numero totale di valori distinti nella colonna. Eseguiamo una stima del numero di valori distinti in una colonna con un errore relativo del 5%.
Valore massimo: il valore più alto nella colonna.
Valore minimo: il valore più basso nella colonna.
Lunghezza massima: la lunghezza del valore più alto nella colonna.
Valori null: il numero di valori null nella colonna.
Valori true: il numero di valori true nella colonna.
Valori false: il numero di valori false nella colonna.
-
numFiles: Il numero totale di file nella tabella. Questo valore è disponibile nella scheda Proprietà avanzate.
- AWS CLI
-
L'esempio seguente mostra come recuparare le statistiche delle colonne utilizzando AWS CLI.
aws glue get-column-statistics-for-table \
--database-name database_name
\
--table-name table_name
\
--column-names <column_name>
È inoltre possibile visualizzare le statistiche delle colonne utilizzando l'GetColumnStatisticsForTableAPIoperazione.