使用彙總在選取的欄位上執行加總計算 - AWS Glue

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

使用彙總在選取的欄位上執行加總計算

若要使用彙總轉換
  1. 將彙總節點新增至任務圖表。

  2. 節點屬性索引標籤上,透過選擇下拉式清單欄位 (選用) 來選擇要分組在一起的欄位。您可以一次選取多個欄位,或在搜尋列中輸入來搜尋欄位名稱。

    選取欄位時,會顯示名稱和資料類型。若要移除欄位,請選擇欄位上的 'X'。

    
               螢幕擷取畫面顯示「彙總」節點的「轉換」索引標籤。
  3. 選擇彙總另一個資料欄。至少需要選取一個欄位。

    
               選擇彙總另一個資料行時,螢幕擷取畫面會顯示這些欄位。
  4. 要彙總的欄位中選擇一個欄位。

  5. 選擇要套用至所選欄位的彙總函數:

    • avg – 計算平均值

    • countDistinct – 計算唯一非空值的數量

    • count – 計算非空值的數量

    • first – 傳回滿足 'group by' 條件的第一個值

    • last – 傳回滿足 'group by' 條件的最後一個值

    • kurtosis – 計算頻率分佈曲線峰值的清晰度

    • max – 傳回滿足 'group by' 條件的最大值

    • min – 傳回滿足 'group by' 條件的最小值

    • skewness – 測量正態分佈的概率分佈的不對稱性

    • stddev_pop – 計算人口標準差,並返回人口方差的平方根

    • sum – 群組中所有值的總和

    • sumDistinct – 群組中不同值的總和

    • var_samp – 群組的樣本變異數 (忽略空值)

    • var_pop – 群組的母體變異數 (忽略空值)