擷取 JSON 路徑 - AWS Glue

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

擷取 JSON 路徑

此轉換會從 JSON 字串資料欄擷取新資料欄。當您只需要幾個資料元素,而且不想將整個 JSON 內容匯入資料表結構描述時,此轉換非常有用。

將「擷取 JSON 路徑」轉換節點新增至您的任務圖表
  1. 開啟資源面板,然後選擇擷取 JSON 路徑,將新轉換新增至您的任務圖表。新增節點時選取的節點將成為其父節點。

  2. 在節點屬性面板中,您可以輸入任務圖表中節點的名稱。如果尚未選取節點父項,請從節點父項清單選擇用作轉換之輸入來源的節點。

  3. 轉換索引標籤上,選取包含 JSON 字串的資料欄。輸入一個或多個以逗號分隔的 JSON 路徑運算式,每個運算式都會參考如何從 JSON 陣列或物件中擷取值。例如,如果 JSON 資料欄包含具有屬性 "prop_1" 和 "prop2" 的物件,則可同時擷取兩者,並指定它們的名稱 "prop_1, prop_2"。

    如果 JSON 欄位具有特殊字元,若要從此 JSON {"a. a": 1} 中擷取屬性,可以使用 $['a. a'] 路徑。例外狀況為逗號,因為它被保留用來分隔路徑。然後輸入每個路徑的對應資料欄名稱,並以逗號分隔。

  4. (選用) 在轉換索引標籤上,您可以選擇在擷取後刪除 JSON 資料欄,這在擷取所需的部分後不需要其餘 JSON 資料時很有意義。