檢視資料欄統計資料 - AWS Glue

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

檢視資料欄統計資料

成功產生統計資料後,Data Catalog 會儲存此位於 Amazon Athena 和 Amazon Redshift 之成本型最佳化工具的資訊,以在執行查詢時進行最佳選擇。統計資料會根據資料欄類型而異。

AWS Management Console
檢視資料表的資料欄統計資料
  • 執行資料欄統計資料任務後,資料表詳細資料頁面中的資料欄統計資料索引標籤會顯示資料表的統計資料。

    螢幕擷取畫面顯示最近一次執行所產生的資料欄。

    下列為可用的統計資料:

    • 資料欄名稱:用來產生統計資料的資料欄名稱

    • 上次更新:統計資料產生時的資料和時間

    • 平均長度:資料欄中值的平均長度

    • 相異值:資料欄中的相異值總數。我們會以 5% 相對誤差率預估資料欄中相異值數。

    • 最大值:資料欄中的最大值。

    • 最小值:資料欄中的最小值。

    • 最大長度:資料欄中的最高值長度。

    • Null 值:資料欄中的 Null 值總數。

    • True 值:資料欄中的 true 值總數。

    • False 值:資料欄中的 false 值總數。

AWS CLI

下列範例顯示如何使用 AWS CLI 擷取資料欄統計資料。

aws glue get-column-statistics-for-table \ --database-name <test_db> \ --table-name <test_tble> \ --column-names <col1>

您可以使用 GetColumnStatisticsForTable API 操作,來檢視資料欄統計資料。