使用「取消樞紐資料欄至資料列」轉換 - AWS Glue

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

使用「取消樞紐資料欄至資料列」轉換

取消樞紐轉換允許您將資料欄轉換為新資料欄的值,並為每個唯一值產生一個資料列。這與樞紐相反,但請注意,它不是等效的,因為它不能將具有彙總的相同值之資料列分開,也不能將組合拆分為原始資料欄 (您可以稍後使用「分割」轉換來執行此操作)。例如,如果您有下列資料表:

year month de uk us
2020 Jan 42 32 64
2020 Feb 11 67 18
2021 Jan 90

您可以取消資料欄樞紐:“de”、“uk” 和 “us” 至值為 “amount” 的資料欄 “country” 中,並取得以下內容 (為了說明目的而在此處排序):

year month country amount
2020 Jan uk 32
2020 Jan de 42
2020 Jan us 64
2020 Feb uk 67
2020 Feb de 11
2020 Feb us 18
2021 Jan us 90

請注意,預設不會產生具有 NULL 值的資料欄 (“de” 和 “uk of Jan 2021”)。您可以啟用該選項以取得:

year month country amount
2020 Jan uk 32
2020 Jan de 42
2020 Jan us 64
2020 Feb uk 67
2020 Feb de 11
2020 Feb us 18
2021 Jan us 90
2021 Jan de
2021 Jan uk
若要新增「取消樞紐資料欄至資料列」轉換:
  1. 開啟資源面板,然後選擇取消樞紐資料欄至資料列,將新轉換新增至您的任務圖表。新增節點時選取的節點將成為其父節點。

  2. (選用) 在節點屬性索引標籤上,您可以輸入任務圖表中節點的名稱。如果尚未選取節點父項,請從節點父項清單選擇用作轉換之輸入來源的節點。

  3. 轉換索引標籤上,輸入要建立的新資料欄,以保留要取消樞紐之所選資料欄的名稱和值。

    螢幕擷取畫面顯示「取消樞紐資料欄至資料列」轉換的「轉換」索引標籤。